for gymnasiet og hf 2016 Karsten Juul

Relaterede dokumenter

for matematik pä B-niveau i hf

for matematik pä B-niveau i hf

for gymnasiet og hf 2017 Karsten Juul

Deskriptiv statistik for hf-matc

Deskriptiv statistik. for C-niveau i hf Karsten Juul

Deskriptiv statistik for matc i stx og hf

for matematik pä B-niveau i hf

Nogle emner fra. Deskriptiv Statistik Karsten Juul

for matematik på C-niveau i stx og hf

for C-niveau i stx 2017 Karsten Juul

Deskriptiv statistik. Version 2.1. Noterne er et supplement til Vejen til matematik AB1. Henrik S. Hansen, Sct. Knuds Gymnasium

Statistik. Peter Sørensen: Statistik og sandsynlighed Side 1

Funktioner generelt. for matematik pä B- og A-niveau i stx og hf Karsten Juul

Statistik. Peter Sørensen: Statistik og sandsynlighed Side 1

Statistik. Deskriptiv statistik, normalfordeling og test. Karsten Juul

Start pä matematik. for gymnasiet og hf (2012) Karsten Juul

Statistik. Kvartiler og middeltal defineres forskelligt ved grupperede observationer og ved ikke grupperede observationer.

sammenhänge for C-niveau i stx 2013 Karsten Juul

Statistisk beskrivelse og test

Funktioner generelt. for matematik pä B-niveau i stx Karsten Juul

for gymnasiet og hf 2011 Karsten Juul

GrundlÄggende variabelsammenhänge

Potensfunktioner samt proportional og omvent proportional. for hf Karsten Juul

c) For, er, hvorefter. Forklar.

Hvad siger statistikken?

Noter til Statistik. Lisbeth Tavs Gregersen. 1. udgave

Eksponentielle funktioner for C-niveau i hf

1hf Spørgsmål til mundtlig matematik eksamen sommer 2014

MATEMATIK A-NIVEAU. Anders Jørgensen & Mark Kddafi. Vejledende eksempler på eksamensopgaver og eksamensopgaver i matematik, 2012

Formelsamling Matematik C

Statistik. Statistik er analyse af indsamlet data. Det vil sige at man bearbejder et datamateriale som i matematik næsten altid er tal.

Statistik er at behandle en stor mængde af tal, så de bliver lettere at overskue og forstå.

Lars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ 2 -test og Goodness of Fit test.

Bilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen

5. Statistik. Hayati Balo,AAMS. 1. Carstensen, Frandsen og Studsgaard, stx mat B2, systime

(VIDENSKABSTEORI) STATISTIK (EKSPERIMENTELT ARBEJDE)

Opgaver om koordinater

Fig. 1 Billede af de 60 terninger på mit skrivebord

Kort om Eksponentielle Sammenhænge

Lineære modeller. Taxakørsel: Et taxa selskab tager 15 kr. pr. km man kører i deres taxa. Hvis vi kører 2 km i taxaen koster turen altså

Lineære sammenhænge. Udgave Karsten Juul

Statistik - supplerende eksempler

Maple 11 - Chi-i-anden test

Deskriptiv statistik (grupperede observationer)

Integralregning. med Ävelser. for B-niveau i gymnasiet og hf Karsten Juul

Under 63 år : 88% Under 55 år : 55% Ved at trække den nederste fra den øverste af de to grupper fås: Melllem 55 og 63 år :

Dig og din puls Lærervejleding

brikkerne til regning & matematik statistik preben bernitt

I. Deskriptiv analyse af kroppens proportioner

2. Ved et roulettespil kan man vinde 0,10,100, 500 og 1000 kr. Sandsynligheden for gevinsterne ses af følgende skema:

Variabel- sammenhænge

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]

Projekt 8.3 Hvordan undersøges om et talmateriale normalfordelt?

Forklar hvad betyder begrebet procent og hvordan man beregner det. Forklar, hvordan man lægger procenter til og trækker procenter fra.

2 -test. Fordelingen er særdeles kompleks at beskrive med matematiske formler. 2 -test blev opfundet af Pearson omkring år 1900.

Matematik C. Højere forberedelseseksamen

Statistik (deskriptiv)

Værktøjshjælp for TI-Nspire CAS Struktur for appendiks:

GL. MATEMATIK B-NIVEAU

STUDENTEREKSAMEN GUX MAJ MATEMATIK A-NIVEAU. Prøveform b. Kl GUX-MAA

Ved et folketingsvalg eller en folkeafstemning spørger man alle stemmeberettigede, og kun en del af dem stemmer.

Funktioner. 2. del Karsten Juul

Under 63 år : 92% Under 55 år : 55% Ved at trække den nederste fra den øverste af de to grupper fås: Melllem 55 og 63 år :

Vejledning i brug af Gym-pakken til Maple

Eksponentielle sammenhænge

Allan C. Malmberg. Terningkast

Huskeliste Printark. U4 Tastetider U5 Hvor hurtigt regner du? E4 Begreber og fagord - Statistik. Materialer. Mobiltelefon Stopur

Løsning til opgave 7, 9, 10 og 11C Matematik B Sommer 2014

Matematik B. Højere handelseksamen

Velkommen til Flemmings store Maplekursus 1. lektion. Skift mellem tekst- og matematikmode

Grupperede observationer et eksempel. (begreber fra MatC genopfriskes og varians og spredning indføres)

Sandsynlighed. for matc i stx og hf Karsten Juul

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

Personlig stemmeafgivning

Undervisningsbeskrivelse

Grupperede observationssæt Deskriptiv statistik: Middelværdi, frekvensfordeling, sumkurve, kvartilsæt, boxplot

Differential- regning

Undervisningsbeskrivelse

Indhold Grupperede observationer... 1 Ugrupperede observationer... 3 Analyse af normalfordelt observationssæt... 4

Antal timer Køn k m k m m k m k m k k k m k k k

Statistikkompendium. Statistik

Skriv punkternes koordinater i regnearket, og brug værktøjet To variabel regressionsanalyse.

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik

Torben Rønne. Statistik. med TI InterActive

Maple-oversigt til matematik B-niveau: Rungsted Gymnasium Definer en funktion og funktionsværdier. Tegn grafen for en funktion.

T A L K U N N E N. Datasæt i samspil. Krydstabeller Grafer Mærketal. INFA Matematik Allan C

Fagligt samspil mellem Ma-B og SA-A Lisbeth Basballe, Mariagerfjord Gymnasium og Marianne Kesselhahn, Egedal Gymnasium og HF

Median, kvartiler, boksplot og sumkurver

Asymptoter. for standardforsøgene i matematik i gymnasiet Karsten Juul

Undersøge funktion ved hjælp af graf. For hf-mat-c.

Et CAS program til Word.

d Kopier formlen fra celle A3 ned i kolonne A. Kopier formlen fra celle C3 ned i kolonne C. Undersøg, hvad der sker med formlen, når den kopieres.

Undervisningsbeskrivelse

Vejledende eksamensopgaver vedr. hypotesetest (stx B og stx A)

Statistik med GeoGebra

Differentialregning. Et oplæg Karsten Juul L P

H Å N D B O G M A T E M A T I K 2. U D G A V E

Transkript:

for gymnasiet og hf 75 50 5 016 Karsten Juul

Statistik for gymnasiet og hf Ä 016 Karsten Juul 4/1-016 Nyeste version af dette håfte kan downloades fra http://mat1.dk/noter.htm HÅftet mç benyttes i undervisningen hvis låreren med det samme sender en e-mail til kj@mat1.dk som oplyser at dette håfte benyttes (angiv fulde titel og Çrstal), og oplyser hold, niveau, lårer og skole. Tidligere udgaver af dette håfte har skiftet adresser til http://mat1.dk/statistik_for_gymnasiet_og_hf_011.pdf http://mat1.dk/statistik_for_gymnasiet_og_hf_013.pdf http://mat1.dk/statistik_for_gymnasiet_og_hf_014.pdf http://mat1.dk/statistik_for_gymnasiet_og_hf_015.pdf DESKRIPTIV STATISTIK Hvad er deskriptiv statistik? 1.1 Hvad er deskriptiv statistik?... 1 1. Hvad er grupperede og ugrupperede data?... 1 1.1 Eksempel pç ugrupperede data... 1 1. Eksempel pç grupperede data... 1 Ugrupperede data.1 Hvordan udregner vi middeltal (middelvårdi) for ugrupperede data?... 1.11 Hvordan udregner vi middeltallet nçr der er fç data?... 1.1 Hvordan udregner vi middeltallet nçr der er mange data?... 1. Hvordan finder vi medianen for ugrupperede data?....1 Hvordan finder vi medianen nçr der er fç data?.... Hvordan finder vi medianen nçr der er mange data?....3 Hvordan finder vi kvartilsåttet for ugrupperede data?... 3.31 Hvis der er et midterste tal... 3.3 Hvis der ikke er et midterste tal... 3.4 Hvordan tegner vi boksplot?... 3.5 Hvordan sammenligner vi boksplot?... 4.51 opgave... 4.5 opgave... 4.53 opgave... 4 Grupperede data 3.1 Hvordan tegner vi et histogram?... 5 3. Et grupperet datasåt er en model af virkeligheden der er meget forenklet.... 5 3.3 Hvordan tegner vi en sumkurve?... 6 3.31 Kumuleret frekvens og sumkurve... 6 3.3 Hvis der er oplyst procent for hvert interval... 6 3.33 Hvis der er oplyst antal for hvert interval... 6 3.34 Hvis start-tal og/eller slut-tal mangler... 6 3.4 Hvordan aflåser vi pç en sumkurve?... 7 3.41 Hvor mange procent af rérene er UNDER 3,7 meter?... 7 3.4 Hvor mange procent af rérene er OVER 5,5 meter?... 7 3.43 Hvor mange procent af rérene er MELLEM 3,7 og 5,5 meter?... 7 3.44 Hvor mange procent af rérene er LIG 3,7 meter ELLER DERUNDER?... 7 3.5 Hvordan finder vi medianen for grupperede data?... 8

3.6 Hvordan finder vi kvartilsåttet for grupperede data?... 8 3.61 Nedre kvartil.... 8 3.6 Ñvre kvartil... 8 3.63 KvartilsÅt... 8 3.7 Middeltal for grupperede data nçr antal (hyppighed) er oplyst... 9 3.8 Middeltal for grupperede data nçr procent (frekvens) er oplyst... 9 4.1 Hvordan grupperer vi data?... 9 4. Hvor brede skal vi gére intervallerne nçr vi grupperer data?... 10 5 Sumkurve og lineår sammenhång.... 10 TEST 6 StikprÉver... 11 6.1 Hvad er populationen?... 11 6. Hvad er stikpréven?... 11 6.3 Systematiske fejl ved valg af stikpréven... 11 6.4 TilfÅldige fejl ved valg af stikpréven... 11 6.5 Er der skjulte variable?... 1 7 Hvad er sandsynlighed?... 1 7.1 Eksempel.... 1 7. Eksempel.... 1 8 Test af hypotese..... 1 8.1 Signifikansniveau.... 1 8. HvornÇr har vi vist noget med en test?... 1 8.3 Tankegangen bag det at forkaste eller ikke forkaste en hypotese... 1 9 Test for uafhångighed i tabel.... 13 9.1 SÇdan udregner vi FORVENTEDE TAL... 13 9. SÇdan udregner vi... 14 9.3 SÇdan udregner vi p.... 14 9.4 SÇdan skriver vi konklusionen... 14 9.5 MisforstÇ ikke procenterne... 14 10 Hvordan udregner vi antal FRIHEDSGRADER i test for uafhångighed?... 15 10.1 Frihedsgrader for gange tabel.... 15 10. Frihedsgrader for gange 3 tabel.... 15 10.3 Frihedsgrader for m gange n tabel.... 15 11 Eksempel med to frihedsgrader i test for uafhångighed... 16 1 Nulhypotese.... 17 13 Test for fordeling nçr stikpréven er angivet som antal.... 17 13.1 SÇdan udregner vi forventede tal.... 17 13. SÇdan udregner vi... 17 13.3 SÇdan udregner vi antal frihedsgrader.... 18 13.4 SÇdan udregner vi p.... 18 13.5 SÇdan skriver vi konklusionen... 18 13.6 MisforstÇ ikke procenttallene.... 18 14 Test for fordeling nçr stikpréven er angivet med procenter... 19 15 Kritisk vårdi.... 19

FORDELINGER Fordeling af teststärrelse 16 Fordeling af teststérrelse... 0 Normalfordeling 17 Tal der er normalfordelt..... 1 18 Graf for tal der er normalfordelt.... 1 19 MiddelvÅrdi for tal der er normalfordelt.... 1 0 Spredning for tal der er normalfordelt.... 1 1 Forskrift for funktion der viser fordelingen af tal der er normalfordelt... En anvendelse af normalfordeling.... -fordeling 3 -fordeling.... 3 4 Forskrift for g... 3 5 -fordeling nçr antal frihedsgrader ikke er 1... 4 6 -fordeling og test... 4 NSPIRE-BESVARELSER N1 Middeltal og kvartilsät ud fra kort liste.... 5 N Middeltal og kvartilsät ud fra lang liste... 5 N3 Middeltal og kvartilsät ud fra hyppighedstabel... 6 N4 Boksplot ud fra kort liste... 6 N5 Boksplot ud fra lang liste... 7 N6 Boksplot ud fra hyppighedstabel... 7 N7 Boksplot ud fra kvartilsät... 8 N8 Boksplot ud fra flere datasät... 8 N9 Histogram... 9 N10 Sumkurve ud fra antal, afläs... 30 N11 Sumkurve ud fra procent... 31 N1 Test for uafhängighed... 3 N13 Test for uafhängighed, m.m... 33 N14 Test for fordeling, antal i stikpråve... 34 N15 Test for fordeling, procent i stikpråve... 35

DESKRIPTIV STATISTIK Hvad er deskriptiv tatistik? 1.1 Hvad er deskriptiv statistik? Deskriptiv statistik er metoder til at fç overblik over tal vi har indsamlet. De tal vi har indsamlet, kalder vi data. 1. Hvad er grupperede og ugrupperede data? Hvis der er mange forskellige data, sç grupperer vi dem i intervaller. (Hvis vi kaster en terning 1000 gange, er der mange data, men kun 6 forskellige, sç disse skal ikke grupperes). 1.1 Eksempel på ugrupperede data. Vi har talt antallet af bår i 15 pakker. Antal bår i en pakke: 4 4 4 3 4 3 6 6 3 8 7 4 1. Eksempel på grupperede data. Vi har vejet 00 frugter: Mellem 100 og 110 gram: 16 frugter Mellem 110 og 10 gram: 68 frugter Mellem 10 og 130 gram: 90 frugter Mellem 130 og 140 gram: 6 frugter Ugrupperede data.1 Hvordan udregner vi middeltal (middelvçrdi) for ugrupperede data? For grupperede data skal vi gére noget andet. Se afsnit 3.7-3.8 pç side 9. Middeltallet for nogle tal er det vi plejer at kalde gennemsnittet. Vi kan udregne middeltallet (middelvårdien) ved at lågge tallene sammen og dividere resultatet med antallet af tal..11 Hvordan udregner vi middeltallet når der er få data? I 7 préver opnçede en elev félgende pointtal: 6 9 8 8 9 7 9 SÇdan udregner vi middeltallet: 6 9 8 8 9 7 8 7,85714 7 Middeltallet for elevens pointtal er 7, 9.1 Hvordan udregner vi middeltallet når der er mange data? De nye elever pç en skole har våret til en préve: Point 1 3 4 5 6 Antal elever 5 58 49 6 18 I tabellen ser vi at 5 elever har fçet 1 point, elever har fçet point, osv. Antallet af pointtal er altsç 5 58 49 6 18 14 Vi behéver ikke lågge de 58 tretaller sammen. Vi fçr det samme ved at udregne 3 58. Middeltallet kan vi altsç udregne sçdan: 15 358 449 56 618 14 Middeltallet for elevernes pointtal er altsç 3, 9 3,9111 Statistik for gymnasiet og hf Side 1 016 Karsten Juul

. Hvordan finder vi medianen for ugrupperede data? For grupperede data skal vi gére noget helt andet. Se afsnit 3.5 pç side 8..1 Hvordan finder vi medianen når der er få data? En klasse har haft en préve. De 17 elever fik félgende point: 5 69 70 0 47 71 48 7 7 6 15 48 3 5 49 39 36 Vi ordner disse tal efter stérrelse sç tallet til venstre er mindst: 15 0 3 7 7 36 39 47 48 48 49 5 5 6 69 70 71 Vi ser at det midterste af tallene er 48. Man siger at tallenes median er 48. Antag at der i stedet havde våret et lige antal tal: 3 3 4 5 6 6 8 9 Da der er et lige antal tal, er der ikke et tal der stçr i midten. I stedet udregner vi gennemsnittet af de to midterste tal: 5 6 5,5. Man siger at tallenes median er 5,5.. Hvordan finder vi medianen når der er mange data? De nye elever pç en skole har våret til en préve: Point 1 3 4 5 6 Antal elever 5 58 49 6 18 I tabellen ser vi at 5 elever har fçet 1 point, elever har fçet point, osv. Antallet af pointtal er altsç 5 58 49 6 18 14 Da 14 : 107, ser det sçdan ud: 107 107 1 1?? 6 6 Tal nr. 6 i denne råkke er férste total da der ifélge tabellen er 5 ettaller. Tal nr. 8 er férste tretal da 5 7. Tal nr. 86 er férste firtal da 7 58 85. Tal nr. 135 er férste femtal da 85 49 134. De to midterste tal, dvs. nr. 107 og 108, er altsç begge firtaller. Da der ikke er noget midterste tal, er medianen gennemsnittet af de to midterste tal. Medianen for elevernes pointtal er altsç 4, 0 I tabellen ovenfor Åndrer vi antallet til 3. SÇ ser det sçdan ud. 107 107 1 1??? 6 6 Vi kan se at nu er det tal nr. 108 der er medianen, dvs. medianen er 4. Statistik for gymnasiet og hf Side 016 Karsten Juul

.3 Hvordan finder vi kvartilsçttet for ugrupperede data? (For grupperede data skal vi gére noget helt andet. Se afsnit 3.6 pç side 8)..31 Hvis der er et midterste tal: 15 0 3 7 7 36 39 47 48 48 49 5 5 6 69 70 71 Medianen for tallene til venstre for det midterste tal kalder vi nedre kvartil. Dvs. nedre kvartil er 7. Medianen for tallene til héjre for det midterste tal kalder vi Évre kvartil. Dvs. Évre kvartil er 57. NÇr vi taler om kvartilsåttet for nogle tal, sç mener vi de tre tal nedre kvartil, median og Évre kvartil, dvs. kvartilsåttet for tallene ovenfor er de tre tal 7, 48, 57..3 Hvis der ikke er et midterste tal: 3 3 4 5 6 6 8 9 Medianen for den venstre halvdel af tallene kalder vi nedre kvartil. Dvs. nedre kvartil er 3,5. Medianen for héjre halvdel af tallene kalder vi Évre kvartil. Dvs. Évre kvartil er 7. KvartilsÅttet er de tre tal 3,5, 5,5, 7, 0..4 Hvordan tegner vi boksplot? Ved at undersége datasåttet 15 0 3 7 7 36 39 47 48 48 49 5 5 6 69 70 71 kan vi se at mindste tal = 15 nedre kvartil = 7 median = 48 Évre kvartil = 57 stérste tal = 71 Disse oplysninger har vi vist pç figuren. SÇdan en figur kaldes et boksplot. 0 10 0 30 40 50 60 70 point De to smç lodrette streger i enderne viser at mindste og stérste tal er 15 og 71. De to lodrette streger i hver ende af rektanglet viser at nedre og Évre kvartil er 7 og 57. Den lodrette streg i midten af rektanglet viser at medianen er 48. Rektanglet anskueliggér at den midterste halvdel af tallene ligger i intervallet fra 7 til 57. Den vandrette streg til venstre anskueliggér at den fjerdedel af tallene der er mindst, ligger i intervallet fra 15 til 7. Den vandrette streg til héjre anskueliggér at den fjerdedel af tallene der er stérst, ligger i intervallet fra 57 til 71. Statistik for gymnasiet og hf Side 3 016 Karsten Juul

.5 Hvordan sammenligner vi boksplot?.51 Opgave Diagrammet viser héjdefordelingen for en plante pç to marker A og B. Sammenlign héjderne pç A og B. Svar Sammenlign stérrelser Alle dele af diagrammet bortset fra héjre endepunkt ligger långere mod héjre pç B, sç héjderne er altsç overvejende stérre pç B selv om den stérste héjde er pç A. Sammenlign spredning BÇde hele diagrammet og kassen er bredere pç A's diagram end pç B's, sç héjderne fra A er mere spredt end héjderne fra B. A B begrundelse resultat begrundelse resultat cm.5 Opgave Diagrammet viser fordelingen af tider for to lébere A og B. Sammenlign tiderne for A og B. Svar Sammenlign stérrelser Venstre endepunkt for B-diagrammet ligger til héjre for héjre endepunkt for A-diagrammet, sç B s mindste tid er stérre end A s stérste tid. Sammenlign spredning A-kassen er meget långere end B-kassen, sç midterste halvdel af tiderne er meget mere spredt for A end for B. Hele diagrammet har ca. samme långde for A og B, sç forskellen pç stérste og mindste tid er ca. den samme for A og B. A B begrundelse resultat begrundelse resultat begrundelse resultat minutter.53 Opgave 01 Diagrammet viser hvordan priserne pç en vare er fordelt i 01 og i 013. 013 (a) Sammenlign priserne i 01 og 013. (b) I 01 betalte en person 53,50 kr. for varen. Hvordan ligger denne pris i forhold til alle 01-priserne for varen? (c) En person betalte et beléb i den laveste halvdel af den héjeste halvdel af 01-priserne. Hvad fortåller dette om stérrelsen af belébet. Svar på (a) Sammenlign stérrelser Hele 013-diagrammet ligger til héjre for venstre halvdel af 01-diagrammet, sç alle 013-priserne er over laveste halvdel af 01-priserne. Hele 01-diagrammet ligger til venstre for kassen i 013-diagrammet, sç alle 01-priserne er lavere end de 75 % héjeste 013-priser. Sammenlign spredning Hverken for kassen eller hele diagrammet er långden Åndret våsentligt fra 01 til 013, sç der er ikke meget forskel pç hvor spredt priserne er i 01 og 013. Svar på (b) 53,50 ligger pç diagrammets venstre linjestykke, dvs. 53,50 kr. er i den nederste fjerdedel af 01-priserne. begrundelse resultat begrundelse resultat Svar på (c) NÇr et beléb er i den laveste halvdel af den héjeste halvdel, er det i héjre del af kassen, dvs. mellem 56,00 kr. og 57,00 kr. begrundelse resultat begrundelse resultat begrundelse resultat kr. Statistik for gymnasiet og hf Side 4 016 Karsten Juul

Grupperede data 3.1 Hvordan tegner vi et histogram? Tabellen viser fordelingen af nogle frugters vågt. VÅgt i gram 100-110 110-10 10-130 130-140 Procent 8 34 45 13 Histogrammet til héjre viser oplysningerne i tabellen. Rektanglet over intervallet 100-110 har héjden héjden 8 %. Dette viser at 8 % af frugterne vejer mellem 100 og 110 gram. BemÅrk: Denne mçde at tegne et histogram pç kan kun bruges fordi intervallerne 100-110, 110-10 osv. er lige lange. Du skal kun kende denne mçde. Advarsel: Den vandrette akse skal tegnes som en sådvanlig tallinje. % gram RIGTIGT: FORKERT: FORKERT: 3. Et grupperet datasçt er en model af virkeligheden der er meget forenklet. Ovenfor har vi set pç félgende grupperede datasåt: VÅgt i gram 100-110 110-10 10-130 130-140 Procent 8 34 45 13 Da dette datasåt er grupperet, skal vi regne som om de 8 % i férste interval er helt jåvnt fordelt i dette interval de 34 % er helt jåvnt fordelt i andet interval osv. Dette betyder bl.a. et vi f.eks. skal regne som om 0 % af dataene er pråcis lig 110. Dette er ikke i modstrid med virkeligheden, for när vi siger at noget vejer 110 g, mener vi ca. 110 g. Hvis vi hermed mener mellem 109 g og 111 g, sä er der ifçlge tabellen 4, % der vejer ca. 110 g. Til eksamen plejer man ikke at spçrge om sädan noget. Der gålder altsç: Den procentdel af dataene der er 110 eller mindre, er lig den procentdel der er mindre end 110. Det giver ingen mening at spérge om 110 er talt med i intervallet 100-110 eller i intervallet 110-10. Dette spérgsmçl giver mening i en opgave hvor du selv skal gruppere nogle data. Se afsnit 4.1 side 9. Statistik for gymnasiet og hf Side 5 016 Karsten Juul

3.3 Hvordan tegner vi en sumkurve? 3.31 Kumuleret frekvens og sumkurve Den kumulerede frekvens af et tal t er den procentdel af dataene der er af stérrelse t eller derunder. Sumkurven er grafen for den kumulerede frekvens. 3.3 Hvis der er oplyst procent for hvert interval. VÅgt i gram 100-110 110-10 10-130 130-140 Frekvens 8 % 34 % 45 % 13 % For at tegne en sumkurve, udregner vi kumulerede frekvenser. Vi har skrevet dem i tabellen, og vi har udregnet dem sçdan: 8% 34% 4%, 4% 45% 87%, osv. Et intervals frekvens, er den procentdel af dataene som intervallet indeholder. Ordet kumuleret betyder ophobet. VÅgt i gram 100 110 10 130 140 Kumuleret frekvens 0 % 8 % 4 % 87 % 100 % For at tegne sumkurven gér vi sçdan: 0 % er mindre end 100, sç ved x 100 afsåtter vi et punkt ud for 0 % pç y-aksen. 8 % er mindre end 110, sç ved x 110 afsåtter vi et punkt ud for 8 % pç y-aksen. 4 % er mindre end 10, sç ved x 10 afsåtter vi et punkt ud for 4 % pç y-aksen. Osv. Da dataene er jåvnt fordelt i hvert interval, skal vi forbinde punkterne med rette linjestykker. (Se evt. begrundelse for dette i afsnit 5 pç side 10). 3.33 Hvis der er oplyst antal for hvert interval. I tabellen stçr antal i stedet for procent. SÇ mç vi omregne til procent for at kunne tegne sumkurven. LÅngde (m) 0,5- -3 3-4 4-5 5-8 Antal rér 34 58 91 7 7 Nedenfor lågger vi sammen fér vi omregner til procent. Det er for at undgç mellemfacitter med mange cifre. Antal data er 34 58 91 7 7 8. Kumuleret hyppighed udregner vi sçdan: 34 58 9, 9 91 183, osv. Kumuleret frekvens udregner vi sçdan: 34 0,10567, 9 0, 3641, osv. 8 8 % I tabellen kan vi skrive hyppighed i stedet for antal rér. Det har vi gjort i tabellen nederst. gram LÅngde i meter 0,5 3 4 5 8 Kumuleret hyppighed 0 34 9 183 55 8 Kumuleret frekvens 0 % 1,1 % 3,6 % 64,9 % 90,4 % 100,0 % 3.34 Hvis start-tal og/eller slut-tal mangler. LÅngde (m) - -3 3-4 4-5 5- Hyppighed 34 58 91 7 7 I denne tabel mangler start-tal og slut-tal. SÇ skal vi kun tegne kurven i de andre intervaller. Kurven bestçr altsç af tre linjestykker. SpÉrgsmÇlene i opgaven vil kunne besvares ved hjålp af den del af kurven vi har tegnet. Statistik for gymnasiet og hf Side 6 016 Karsten Juul

3.4 Hvordan aflçser vi på en sumkurve? Figuren viser sumkurven for rérene fra tabellen pç foregçende side. % 9% 55% 3,7 m 5,5 m m 3.41 Hvor mange procent af rärene er UNDER 3,7 meter? Svar: Som vist pç figuren aflåser vi at 55% af rérene er under 3,7 meter. 3.4 Hvor mange procent af rärene er OVER 5,5 meter? Svar: Som vist pç figuren aflåser vi at 9 % af rérene er under 5,5 meter. Da 100% 9% 8%, er 8% af rérene over 5,5 meter. 3.43 Hvor mange procent af rärene er MELLEM 3,7 og 5,5 meter? Svar: Fra de 9 % der er under 5,5 meter, skal fraregnes de 55 % der er under 3,7 meter. Da 9% 55% 37%, er 37% af rérene mellem 3,7 og 5,5 meter. 3.44 Hvor mange procent af rärene er LIG 3,7 meter ELLER DERUNDER? Svar: Det er samme spérgsmçl som spérgsmçlet 3.41 ovenfor da 0 % af rérene er pråcis lig 3,70000 meter. Det at der pç sumkurven er 0 % der er lig 3,7 meter, er ikke i modstrid med at nogle af rérene er mçlt til 3,7 meter. (LÅs evt. forklaringen pç dette i afsnit 3. pç side 5 ). Statistik for gymnasiet og hf Side 7 016 Karsten Juul

3.5 Hvordan finder vi medianen for grupperede data? For ugrupperede data skal vi gére noget helt andet. Se afsnit. pç side. For at finde medianen skal vi bruge sumkurven nçr det er grupperede data. Vi starter i 50 % pç y-aksen, gçr vandret hen til sumkurven, gçr lodret ned pç x-aksen, og aflåser x-vårdien. Denne x-vårdi er medianen. At et tal er median, betyder altsç at 50 % af dataene er mindre end dette tal og 50 % af dataene er stérre end dette tal. PÇ figuren er medianen 43. 3.6 Hvordan finder vi kvartilsçttet for grupperede data? For ugrupperede data skal vi gére noget helt andet. Se afsnit.3 pç side 3. For at finde kvartilsåttet skal vi bruge sumkurven nçr det er grupperede data. 3.61 Nedre kvartil. Vi starter i 5 % pç y-aksen, gçr vandret hen til sumkurven, gçr lodret ned pç x-aksen, og aflåser x-vårdien. Denne x-vårdi er nedre kvartil. At et tal er nedre kvartil, betyder altsç at 5 % af dataene er mindre end dette tal og 75 % af dataene er stérre end dette tal. PÇ figuren er nedre kvartil 33,5. 3.6 Évre kvartil. Vi starter i 75 % pç y-aksen, gçr vandret hen til sumkurven, gçr lodret ned pç x-aksen, og aflåser x-vårdien. Denne x-vårdi er Évre kvartil. At et tal er Ävre kvartil, betyder altsç at 75 % af dataene er mindre end dette tal og 5 % af dataene er stérre end dette tal. PÇ figuren er Évre kvartil 51. 3.63 KvartilsÇt. 50% 10% 10 43 Dette har du brug for at vide när du har fundet medianen og skal svare pä hvad dette tal fortéller. I dit svar skal du i stedet for data skrive det ord der stär i opgaven, f.eks. léngde, og i stedet for dette tal skal du skrive det tal du har fundet, f.eks. 43. 75% 50% 5% 10% NÇr vi taler om kvartilsåttet for nogle tal, sç mener vi de tre tal nedre kvartil, median, Évre kvartil, dvs. kvartilsåttet er de tre tal 33,5, 43, 51. 33,5 10 43 Dette har du brug for at vide när du har fundet nedre kvartil og skal svare pä hvad dette tal fortéller. I dit svar skal du i stedet for data skrive det ord der stär i opgaven, f.eks. léngde, og i stedet for dette tal skal du skrive det tal du har fundet, f.eks. 33,5. Dette har du brug for at vide när du har fundet Çvre kvartil og skal svare pä hvad dette tal fortéller. I dit svar skal du i stedet for data skrive det ord der stär i opgaven, f.eks. léngde, og i stedet for dette tal skal du skrive det tal du har fundet, f.eks. 51. 51 Statistik for gymnasiet og hf Side 8 016 Karsten Juul

3.7 Middeltal for grupperede data når antal (hyppighed) er oplyst Vi vil udregne middeltallet for félgende grupperede datasåt: LÅngde i meter 0,5- -3 3-4 4-5 5-8 Antal rér 34 58 91 7 7 For at udregne middeltallet forestiller vi os at de 34 tal i férste interval alle er lig tallet i midten af dette interval, de 58 tal i andet interval alle er lig tallet i midten af dette interval, osv. Dette Åndrer ikke middeltallet da tallene er jåvnt fordelt i hvert interval. 0,5 3 Tallet i midten af intervallet udregner vi sçdan: 1, 5,, 5, osv. Tal i midten af intervallet 1,5,5 3,5 4,5 6,5 Hyppighed 34 58 91 7 7 Antal data er 34 58 91 7 7 8. Middeltallet udregnes sçdan: 1,5 34,5 58 3,5 91 4,5 7 6,5 7 3,56560 Middeltal for rérs långde er 3,57cm. 8 Det er nemmere at gange med 7 end 7 gange at skrive 6,5. 3.8 Middeltal for grupperede data når procent (frekvens) er oplyst Vi vil udregne middeltallet for félgende grupperede datasåt: LÅngde i meter 0,5- -3 3-4 4-5 5-8 Frekvens 1 % 18 % 35 % 5 % 10 % For at udregne middeltallet forestiller vi os at de 1 % i férste interval alle er lig tallet i midten af dette interval, de 18 % i andet interval alle er lig tallet i midten af dette interval, osv. Dette Åndrer ikke middeltallet da tallene er jåvnt fordelt i hvert interval. 0,5 3 Tallet i midten af intervallet udregner vi sçdan: 1, 5,, 5, osv. Tal i midten af intervallet 1,5,5 3,5 4,5 6,5 Frekvens 1 % 18 % 35 % 5 % 10 % Middeltallet udregnes sçdan: 1,51,5 18 3,5 35 4,5 5 6,5 10 100 4.1 Hvordan grupperer vi data? Vi har modtaget et datasåt pç 60 tal (enhed er mm): 63 71 7 78 67 78 84 74 73 66 66 70 7 75 71 7 76 75 8 77 71 6 73 66 75 74 79 68 64 71 7 76 76 8 71 63 6 69 70 69 73 7 78 79 8 75 7 76 77 63 80 83 68 83 66 75 75 8 73 77 3,6 Middeltal for rérs långde er 3,6cm. For at fç overblik over disse tal vil vi gruppere dem i félgende intervaller: 60-65 65-70 70-75 75-80 80-85 I rammen har vi skrevet disse intervaller under hinanden. FÉrste tal i datasåttet er 63. Derfor såtter vi en streg ud for 60-65. Andet tal i datasåttet er 71. Derfor såtter vi en streg ud for 70-75. Osv. Et tal i datasåttet der er lig et af intervalendepunkterne, tåller vi med i intervallet til venstre for tallet. Dette er ikke eneste mäde at gçre det pä, men der er tradition for at bruge denne mäde i det danske gymnasium og hf. Efter at vi har foretaget denne optålling, kan vi opskrive det grupperede datasåt: LÅngde i mm 60-65 65-70 70-75 75-80 80-85 Antal 6 11 3 13 7 Statistik for gymnasiet og hf Side 9 016 Karsten Juul

4. Hvor brede skal vi gäre intervallerne når vi grupperer data? PÇ computer kan vi nemt Åndre intervallernes bredde og se hvordan histogrammet Åndres. Histogrammerne viser tre forskellige grupperinger af samme data. PÇ y-aksen stçr antal. Venstre figur: For lille intervalbredde. FÇ data i hvert interval fçr héjde til at svinge tilfåldigt. Midterste figur: Intervallernes bredde er passende. HÄjre figur: For stor intervalbredde. UnÉdig forenklet beskrivelse af hvordan data er fordelt. 5 Sumkurve og lineçr sammenhçng. Histogrammet viser et grupperet datasåt: Intervallet 0-30 deler vi op i 10 lige store dele (se figur). Hver af disse smç intervaller mç indeholde en tiendedel af hele intervallets observationer, dvs. de indeholder 0% 40% 30% hver 3 % af samtlige observationer. ( x, y) er et punkt pç sumkurven, dvs. y er den procentdel af observationerne der har stérrelse x eller derunder. Af histogrammet ovenfor ser vi: NÇr x 0 er y 0,0 0,40 0, 60 NÇr x 1 er y 0,60 0,03 0, 63 NÇr x er y 0,63 0,03 0, 66 Hver gang x bliver 1 stérre, vil y blive 0,03 enheder stérre, sç y vokser lineårt i intervallet fra x 0 til x 30. Derfor er grafen en ret linje i dette interval, og ligningen er y 0, 03x b. Vi udregner b : NÇr x 0 er y 0, 60 sç 0,60 0,03 0 b. Heraf ser vi at b 0, sç ligningen er y 0, 03x. For de fire intervaller er ligningerne: 0-10: y 0, 0x 10-0: y 0,04x 0, 0-30: y 0, 03x 30-40: y 0,01x 0, 6 Hvor mange procent af observationerne har stärrelse 7 eller derunder? Vi ser at vi skal bruge ligningen fra tredje interval: y 0,03 7 0,81 dvs. 81 % af observationerne er 7 eller derunder. 10 % Hvor stor er nedre kvartil? Vi skal gç ud fra 5 % pç y-aksen. Vi ser at vi skal bruge ligningen fra andet interval: 0,5 0,04x 0,. Vi léser denne ligning mht. x og fçr 11,5, dvs. nedre kvartil er 11,5. % Sumkurve Histogram Statistik for gymnasiet og hf Side 10 016 Karsten Juul

6 StikprÄver. TEST Nogen pç et gymnasium mener at der er forskel pç hvad piger og drenge mener om et bestemt spérgsmçl. For at undesége denne hypotese, spérger vi nogle piger og drenge. 6.1 Hvad er populationen? De ting eller personer som vi vil pçstç noget om, kaldes populationen. Er det alle personer i europa som nu er mellem 10 og 0 Çr? Er det alle elever pç vores gymnasium? Eller? NÇr vi laver en statistisk underségelse, skal vi skrive en pråcisering af hvad det er for en population vi vil påstå noget om. 6. Hvad er stikpräven? Vi underséger kun en lille del af hele populationen. De personer vi fçr et svar fra (eller de ting vi underséger), kaldes stikpréven. NÇr vi laver en statistisk underségelse, skal vi skrive en pråcisering af hvordan vi har valgt stikpräven. Det er IKKE nok at skrive: Vi har spurgt 47 elever pç vores gymnasium. Det er nok at skrive Den 0. februar mellem kl. 8:50 og 9:10 spurgte vi de 47 elever der sad pç gangen, og vi fik svar fra dem alle. 10 af drengene og 8 af pigerne var fra 3g FY, 13 af drengene og 16 af pigerne var fra 3g Fy. eller Den 0. februar kl. 8:50 sendte vi en besked til alle elever pç skolen. StikprÉven er de 47 elever der svarede inden kl. 10:00 den. februar. Disse to beskrivelser af en indsamling af stikpréve er sç grundige at låseren kan se om der er grund til tro at der kan våre systematiske fejl. 6.3 Systematiske fejl ved valg af stikpréven. Eksempel 1 Population: Eleverne pç vores gymnasium. StikprÉve: Eleverne i en sproglig klase. Her kan vi have lavet en systematisk fejl ved valg af stikpréven, for det kan våre at en bestemt holdning oftere er blandt sproglige end blandt andre. Eksempel Hvis vi spérger elever pr. e-mail, og mange ikke svarer, sç kan vi have lavet en systematisk fejl, for det er mçske isår elever med en bestemt holdning der svarer. 6.4 TilfÇldige fejl ved valg af stikpréven. Selv om vi vålger stikpréven tilfåldigt blandt hele populationen, er det ikke helt sikkert at den ligner populationen. Det kan f.eks. våre at vi tilfåldigt har fçet for mange ja-sigere med i stikpréven. Det er muligheden for tilfåldige fejl vi beskåftiger os med nçr vi udregner tallet p. (se afsnit 9.3 og 13.4). Afsnit 6 fortsätter på näste side. Statistik for gymnasiet og hf Side 11 016 Karsten Juul

6.5 Er der skjulte variable? En skjult variabel er noget der kan ÉdelÅgge resultatet selv om stikpréven er udvalgt tilfåldigt blandt hele populationen. Eksempel: Der er flere der overlever pç hospital A end pç hospital B. Man slutter at behandlingen er bedre pç A end pç B. Men forskellen skyldes at B har flere Åldre patienter. Patienternes alder er en skjult variabel der pçvirker resultatet. 7 Hvad er sandsynlighed? 7.1 Eksempel. At sandsynligheden for at vinde = 5% betyder at vi vinder 5% af gangene. 7. Eksempel. At sandsynligheden for at en pose har 3 eller flere defekte = 4 % betyder at 4 % af poserne har 3 eller flere defekte. 8 Test af hypotese. 8.1 Signifikansniveau. Hypotese: Halvdelen af brikkerne er gule. Vi tager en stikpréve for at teste hypotesen. Vi fçr en stikpréve der ligger langt fra hypotesen. Vi udregner at hvis hypotesen er rigtig, sç er sandsynligheden kun 3 % for at fç en stikpréve der ligger sç langt eller långere fra hypotesen, Hvis 3 % er mindre end det valgte signifikansniveau, sç forkaster vi hypotesen. Hvis vi har valgt signifikansniveau = 5 %, sç forkaster vi da 3 % < 5 %. Hvis vi har valgt signifikansniveau = 1 %, sç forkaster vi ikke da 3 % 1%. 8. HvornÅr har vi vist noget med en test? Kun nçr vi forkaster en hypotese, har vi vist noget. NÇr vi ikke forkaster hypotesen, har vi IKKE vist at hypotesen sandsynligvis er rigtig. Mange (ogsç lårere og lårebéger) tror at nçr vi ikke kan forkaste hypotesen, sç er det sandsynligt at hypotesen er rigtig. Dette er en katastrofal misforstçelse. Det har ingen forbindelse med virkeligheden. I nogle eksamensopgaver og vejledende opgaver spérges om der er belåg for uafhångighed. At spérge sçdan er en grov fejl da testen aldrig kan give belåg for uafhångighed. 8.3 Tankegangen bag det at forkaste eller ikke forkaste en hypotese. Antag at vi har fundet ud af félgende: Hvis det hypotese A siger, er rigtigt, sç er det usandsynligt at fç en stikpréve der ser ud som den vi har fçet. SÇ tror vi ikke at det hypotese A siger, er rigtigt. Vi forkaster hypotese A. Antag at vi har fundet ud af félgende: Hvis det hypotese A siger, er rigtigt, sç er det IKKE usandsynligt at fç en stikpréve der ser ud som den vi har fçet. SÇ forkaster vi ikke A. Hvis vi ikke forkaster A, er det sç sandsynligt at A er rigtig? NEJ, for der er altid flere hypoteser B, C, D... hvorom der gålder: Hvis det hypotesen siger, er rigtigt, sç er det IKKE usandsynligt at fç en stikpréve der ser ud som den vi har fçet. Statistik for gymnasiet og hf Side 1 016 Karsten Juul

9. Test for uafhçngighed i tabel. Vi vil teste om piger og drenge har samme holdning til et spérgsmçl. Populationen er alle danskere hvis alder er 16 til 18 Çr. Hypotese: Andelen der siger ja, er ens for piger og drenge. Hypotesen er altsç at svaret er uafhångigt af om det er en pige eller en dreng. I den slags test vi laver her, gålder altid: Hypotesen er at noget er ens. Vi vålger: signifikansniveau = 5% Nogle tilfåldigt udvalgte piger og drenge fçr stillet samme spérgsmçl. StikprÉven er de piger og drenge som svarede. De svarede sçdan: Faktiske tal ja nej piger 87 46 drenge 71 1 9.1 SÅdan udregner vi FORVENTEDE TAL. For at teste hypotesen, udregner vi férst noget vi kalder de forventede tal, dvs. hvordan svarene skulle våre fordelt mellem de fire felter hvis ja-andelen i tabellen skulle våre ens for piger og drenge. For at kunne udregne de forventede tal udregner vi férst félgende tal: Antal piger: 87 46 133 Antal drenge: 71 1 9 Antal ja-sigere: 87 71 158 Antal nej-sigere: 46 1 67 Antal piger og drenge: 133 9 5 Disse tal skriver vi i et skema: ja nej i alt piger 133 drenge 9 i alt 158 67 5 I tabellen med forventede tal skal andelen af ja-sigere våre den samme for piger og drenge, sç da 158 af de 5 elever svarede ja, skal vi i denne tabel skrive at 158 5 af de 133 piger svarede ja: 133 158 5 forventet antal ja-svar fra piger: 93, 40 forventet antal nej-svar fra piger: 133 93,40 39, 60 forventet antal ja-svar fra drenge: 158 93,40 64, 60 forventet antal nej-svar fra drenge: 9 64,60 7, 40 Her er de fire forventede tal skrevet ind i skemaet: Forventet ja nej i alt piger 93,40 39,60 133 drenge 64,60 7,40 9 i alt 158 67 5 Statistik for gymnasiet og hf Side 13 016 Karsten Juul

9. SÅdan udregner vi. Symbolet låses sçdan: ki i anden For hvert af de fire felter udregner vi ( faktisk forventet) forventet Ved at lågge disse fire tal sammen fçr vi tallet : χ (87 93,40) 93,40 χ 3,60 (46 39,60) 39,60 (71 64,60) 64,60 (1 7,40) 7,40 TeststÉrrelsen 3,60 er afstanden mellem de faktiske tal og de forventede tal. 9.3 SÅdan udregner vi p. Ovenfor udregnede vi at afstanden mellem faktiske og forventede tal er χ 3, 60. I beregningsmenuen vålger vi Statistik / Fordelinger / Cdf... og udfylder sçdan: Vi kan skrive: Nspire: Dvs. p = 5,8 % hvor p er sandsynligheden hvis hypotesen er rigtig, for at afstanden er 3,60 eller stérre nçr antal frihedsgrader er 1. 9.4 SÅdan skriver vi konklusionen. Da sigifikansniveauet er 5 %, og p ikke er mindre end 5 %, kan vi ikke forkaste hypotesen. StikprÉven giver ikke belåg for at håvde at andelen der siger ja, er forskellig for piger og drenge. Tallet 1 er antal frihedsgrader. Se afsnit 10. 9.5 MisforstÅ ikke procenterne. 5,8 % er IKKE sandsynligheden for at hypotesen er rigtig. 5,8 % er IKKE sandsynligheden for at hypotesen er forkert. 94, % er IKKE sandsynligheden for at hypotesen er rigtig. 94, % er IKKE sandsynligheden for at hypotesen er forkert. De 5,8 % er udregnet under den forudsåtning at hypotesen er rigtig og er sandsynligheden for at fç en stikpréve hvis afvigelse fra hypotesen er sç stor som eller stérre end afvigelsen i den stikpréve vi fik. Statistik for gymnasiet og hf Side 14 016 Karsten Juul

10 Hvordan udregner vi antal FRIHEDSGRADER i test for uafhçngighed? 10.1 Frihedsgrader for gange tabel. Tabellen stammer fra en underségelse af om der er forskel pç drenges og pigers holdning til det stillede spérgsmçl. I tabellen er der råkker (piger og drenge) og séjler (ja og nej). i alt 158 67 5 Hvis vi skriver et tal i ât af de fire felter, sç er det fastlagt hvad der skal stç i de tre andre felter. Det er fordi bçde antal piger, antal drenge, antal ja og antal nej er kendt. Fordi man kun kan vålge 1 tal, er antallet af frihedsgrader 1. ja nej i alt piger 87 133 drenge 9 10. Frihedsgrader for gange 3 tabel. Tabellen stammer fra en underségelse ja nej? i alt af om der er forskel pç drenges og pigers holdning til det stillede piger 35 1 61 spérgsmçl. I tabellen er der råkker (piger og drenge) og 3 séjler (ja, nej og?). drenge i alt 58 3 5 45 106 Hvis vi skriver tal i to af de seks felter, sç er det fastlagt hvad der skal stç i de fire andre felter. Det er fordi bçde antal piger, antal drenge, antal?, antal ja og antal nej er kendt. Fordi man kun kan vålge tal, er antallet af frihedsgrader. 10.3 Frihedsgrader for m gange n tabel. Hvis der i test for uafhångighed er sç er m råkker og n séjler, antal frihedsgrader = ( m 1) ( n 1) Nogle gange skal vi udregne antal frihedsgrader pç en anden mçde. Se afsnit 13.3. Hvis m og n, sç fçr vi af denne formel at antal frihedsgrader = ( 1) ( 1) 11 1 ADVARSEL: Nogle gange skal vi udregne antal frihedsgrader pç en anden mçde. Se afsnit 13.3. Statistik for gymnasiet og hf Side 15 016 Karsten Juul

11 Eksempel med to frihedsgrader i test for uafhçngighed. Populationen er alle danske elever i 1.g som har matematik pç A- eller B-niveau. Vi vil teste félgende hypotese pç 5 %-signifikansniveau: Hypotese: Eleverne på A-niveau og B-niveau er lige gode til brçkregning. StikprÉven er nogle elever som fik en préve i brékregning. Hver elev fik under middel, middel eller over middel. Resultatet stçr i tabellen. under middel over i alt Faktiske tal: Vi udregner de forventede vårdier: mat A 51 65 78 194 mat B 44 7 46 16 i alt 95 137 14 356 95 af de 356 elever fik under middel, sç hvis hypotesen er rigtig, mç vi forvente at ogsç 95 356 af mat A-eleverne fik under middel. 95 356 Det forventede antal er altsç 194 51, 77. 137 356 Det forventede antal mat A-elever med karakteren middel er 194 74, 66. Vi kan fortsåtte sçdan for at udregne resten af de forventede tal, men vi kan ogsç udregne resten af de forventede vårdier ved at bruge at vi kender summen af hver råkke og séjle. Det forventede antal mat B-elever med karakteren under middel kan vi altsç udregne sçdan: 95 51,77 43, 3. Forventede tal: under middel over i alt mat A 51,77 74,66 67,57 194 mat B 43,3 6,34 56,43 16 i alt 95 137 14 356 Vi udregner teststérrelsen som er afstanden mellem de faktiske tal og de forventede tal: (5151,77) (6574,66) (7867,57) (4443,3) (76,34) (4656,43) 51,77 74,66 67,57 43,3 6,34 56,43 Vi fçr 6, 31. Antal frihedsgrader = (antal råkker 1) (antal séjler 1) = ( 1) (3 1) = Nogle gange skal vi udregne antal frihedsgrader pç en anden mçde. Se afsnit 13.3. Vi udregner p som er sandsynligheden hvis hypotesen er rigtig for at er i hvert fald 6,31: Nspire: Dvs. p = 4,3 % hvor p er sandsynligheden hvis hypotesen er rigtig, for at afstanden er 6,31 eller stérre nçr antal frihedsgrader er. Da p er mindre end 5 %, forkaster vi hypotesen, sç pç 5 %-signifikansniveau har vi vist: Eleverne pç A-niveau og B-niveau er ikke lige dygtige til brékregning. Statistik for gymnasiet og hf Side 16 016 Karsten Juul

1 Nulhypotese. NÇr vi udférer en test, sç underséger vi om en bestemt hypotese kan forkastes. Denne hypotese kaldes nulhypotesen. Nulhypotesen skal pçstç at noget er ens. Dette kan udtrykkes pç flere mçder. FÉlgende fire såtninger er samme hypotese: Der er ikke forskel pç pigers og drenges holdning til spérgsmçlet. Pigers og drenges holdning til spérgsmçlet er ens. Elevers holdning til spérgsmçlet er uafhångig af kén. Elevers kén har ikke betydning for deres holdning til spérgsmçlet. Der er ikke sammenhång mellem kén og holdning til spérgsmçlet. Den alternative hypotese er den hypotese som vi har belåg for at håvde hvis testen forkaster nulhypotesen. Hvis vi vil undersége om der er forskel pç pigers og drenges holdning til et spérgsmçl, sç skal vi skrive félgende nulhypotese: Nulhypotese: Pigers og drenges holdning er ens. Alternativ hypotese: Pigers og drenges holdning er forskellig. 13 Test for fordeling når stikpräven er angivet som antal. I et land er det muligt at stemme pç pç fire partier A, B, C og D. Hypotese: Tilslutningen til partierne er som vist i tabellen. Hypotese: A B C D 33 % 8% 39 % 0 % Vi spérger folk der er tilfåldigt valgt blandt dem der mç stemme, og fçr félgende 150 svar: Faktiske tal: A B C D 46 55 7 Populationen er dem der mç stemme. StikprÉven er dem der svarede. Vi vil teste hypotesen pç signifikansniveu 5 %. 13.1 SÅdan udregner vi forventede tal. Hvis hypotesen er rigtig, mç vi forvente félgende tal: A: 150 0,33 49, 5 B: 150 0,08 1 C: 150 0,39 58, 5 D: 1500,0 30 Forventede tal: A B C D 49,5 1 58,5 30 13. SÅdan udregner vi. Symbolet låses ki i anden For hvert af de fire felter udregner vi ( faktisk forventet) forventet Ved at lågge disse fire tal sammen fçr vi teststérrelsen som er afstanden mellem de faktiske tal og de forventede tal: (46 49,5) 49,5 ( 1) 1 (55 58,5) 58,5 (7 30) 30 0,47475 + 8,33333 + 0,0940 + 0,3 9,09 Langt det stérste bidrag til teststérrelsen er 8,33333 som stammer fra B. Statistik for gymnasiet og hf Side 17 016 Karsten Juul

13.3 SÅdan udregner vi antal frihedsgrader. Ovenfor skrev vi tal i félgende skema: A B C D I alt NÇr vi har skrevet tal i tre af felterne, sç er det fastlagt hvad der skal stç i det sidste felt da summen skal våre 150. Antal frihedsgrader er 3 da vi kan vålge tre af tallene. I test for fordeling gålder: antal frihedsgrader = antal felter 1. 150 Nogle gange skal vi udregne antal frihedsgrader pç en anden mçde. Se afsnit 10.3. 13.4 SÅdan udregner vi p. Ovenfor udregnede vi at afstanden mellem faktiske og forventede tal er χ 9, 09. I beregningsmenuen vålger vi Statistik / Fordelinger / Cdf... og udfylder sçdan: Vi kan skrive: Nspire: Dvs. p =,8 % hvor p er sandsynligheden hvis hypotesen er rigtig, for at afstanden er 9,09 eller stérre nçr antal frihedsgrader er 3. 13.5 SÅdan skriver vi konklusionen. Da p er mindre end 5 %, forkaster vi hypotesen. PÇ 5 %-signifikansniveau har vi belåg for at håvde at: Fordelingen er ikke som vist i férste tabel. 13.6 MisforstÅ ikke procenttallene.,5 % er IKKE sandsynligheden for at hypotesen er rigtig.,5 % er IKKE sandsynligheden for at hypotesen er forkert. 97,5 % er IKKE sandsynligheden for at hypotesen er rigtig. 97,5 % er IKKE sandsynligheden for at hypotesen er forkert. De,5 % er udregnet under den forudsåtning at hypotesen er rigtig og er sandsynligheden for at fç en stikpréve hvis afvigelse fra hypotesen er sç stor som eller stérre end afvigelsen i den stikpréve vi fik. Statistik for gymnasiet og hf Side 18 016 Karsten Juul

14 Test for fordeling når stikpräven er angivet med procenter. I et land er det muligt at stemme pç pç fire partier A, B, C og D. Hypotese: Tilslutningen til partierne er som vist i tabellen. Hypotese: A B C D 33 % 8% 39 % 0 % Nogen har spurgt folk der er tilfåldigt valgt blandt dem der mç stemme, og har fçet svar fra 150. De har angivet resultatet i procenter sçdan: Vores data: A B C D 30,7 % 14,7 % 36,7 % 18,0 % For at kunne teste hypotesen mç vi udregne de faktiske tal som disse procenter er udregnet ud fra. I tabellen med faktiske tal SKAL alle tal våre hele tal. (I tabellen med forventede tal mç der gerne stç kommatal). A: 150 0,307 46, 05 B: 150 0,147, 05 C: 150 0,367 55, 05 D: 150 0,18 7 Faktiske tal: A B C D 46 55 7 Da vi nu har de faktiske tal, kan vi udfére testen pç samme mçde som i afsnit 13. 15 Kritisk vçrdi. Hver dag underséger vi nogle varer med en -test med frihedsgrader og signifikansniveau 5 %. En dag er = 6,88. SÇ er p = 3,%, dvs. vi forkaster. En dag er = 4,68. SÇ er p = 9,6 %, dvs. vi forkaster ikke. NÇr = 6,88 forkaster vi, og nçr = 4,68 forkaster vi ikke. Der mç våre en -vårdi mellem 6,88 og 4,68 som skiller mellem at forkaste og ikke forkaste. Vi vil finde den vårdi der skiller, dvs. den -vårdi hvor p = 5 % : Nspire léser ligningen χãcdf(,,) = 0,05 mht. og fçr = 5,99. Tallet 5,99 kaldes den kritiske vårdi. De dage hvor er stérre end 5,99, forkaster vi hypotesen. (I andre test vil de kritiske vårdier normalt våre andre tal). Statistik for gymnasiet og hf Side 19 016 Karsten Juul

Fordeling af teststärrelse 16 Fordeling af teststärrelse FORDELINGER I skemaet er nogle elever inddelt pç to mçder: mçde 1: pige eller dreng mçde : svarer ja eller nej De to inddelinger er uafhångige af hinanden hvis H 0 : sandsynlighed for ja er ens for pige og drenge dvs. hvis H 0 : brékdel af piger der siger ja = brékdel af drenge der siger ja. Man vålger tilfåldigt en stikpréve blandt eleverne og udfylder skemaet ovenfor. Selv om populationen opfylder brékdel af piger der siger ja = brékdel af drenge der siger ja, kan vi ikke forvente at dette gålder stikpréven (skemaet). Hvis skemaet er meget langt fra at opfylde dette, sç gåtter vi pç at H 0 er forert. Vi siger at vi forkaster nulhypotesen. Ud fra stikpréven (skemaet) udregner vi et tal (teststérrelsen ) som er et udtryk fra stikpréves afstand fra hypotese. (Tallet udregnes ved at bruge formlen i afsnit 9.). Hvis hypotesen er rigtig og vi mange gange tager en stikpréve og udregner tallet, sç fçr vi tal der er fordelt som kurven viser. 1 x 1 f ( x) x e, x 0. π Forskriften for f skal du IKKE huske! Eksempel: Areal mellem graf og x-akse i intervallet 1 x er 0,16. Det betyder at 16% af tallene ligger i intervallet. Hele arealet mellem graf og x-akse mç våre 1 (100 %). 1 f ( x) dx 0,16. Hvis vi fçr en stikpréve med =,5, sç er p lig sandsynligheden hvis hypotesen er rigtig, for at fç en stikpréve hvor er,5 eller stérre. PÇ sidste figur ser vi at p er 0,1, altsç 10 %, sç vi forkaster ikke hypotesen hvis signifikansniveau er 5 %..5 f ( x) dx 0,1. Statistik for gymnasiet og hf Side 0 016 Karsten Juul

Normalfordeling 17 Tal der er normalfordelt. Vi mçler héjden af alle drenge i 3.g. De mçlte tal afsåtter vi som prikker pç en tallinje. Tallene ligger ikke jåvnt fordelt. De er fordelt sçdan: Der er et sted pç tallinjen hvor tallene ligger tåt. Jo långere man kommer fra dette sted, jo mindre tåt ligger tallene. NÇr vi mçler ting af samme slags, vil tallene ofte våre fordelt pç en bestemt mçde som vi kalder normalfordelt. F.eks. er héjderne af drengene i 3.g normalfordelt. 18 Graf for tal der er normalfordelt. Grafen til venstre viser hvordan nogle mçlte tal er fordelt. Hvis vi afsåtter tallene som prikker pç x-aksen, vil prikkerne ligge tåttest der hvor y er stérst, dvs. når 13 pç x-aksen ligger prikkerne tåttest. NÅr 11 pç x-aksen er y mindre, sç når 11 vil prikkerne ligge mindre tåt. NÅr 6 vil prikkerne ligge meget mindre tåt da y er tåt pç 0. Arealet under grafen er 1 = 100 %. I intervallet 13 x 14 er arealet under grafen 0,191, dvs. i dette interval ligger 19,1 % af de mçlte tal. I intervallet 15 x 16 er arealet under grafen 0,09, dvs. i dette interval ligger 9, % af de mçlte tal. Grafen for g er bredere end grafen for f. Til gengåld er den lavere da arealet under grafen skal våre 1. NÇr grafen er bredere, ligger tallene mere spredt. 19 MiddelvÇrdi for tal der er normalfordelt. MiddelvÅrdien af de mçlte tal er 13, da grafen er symmetrisk om x =13. Dette gålder bçde for f og g. g f f f 0 Spredning for tal der er normalfordelt. PÇ f-grafen ser vi at hvis vi fra middelvårdien gçr ud til begge sider, sç fçr vi 68,3 % af tallene med. Vi siger at tallenes spredning er fordi vi skal gç ud fra middelvårdien for at fç 68,3 % af tallene med. PÇ g-grafen ser vi at spredningen er 3. 1 Forskrift for funktionen der viser fordelingen af tal der er normalfordelt. NÇr tal er normalfordelt med middelvårdi m og spredning s, sç vil funktionen f der viser fordelingen, have félgende forskrift: Statistik for gymnasiet og hf Side 1 016 Karsten Juul g f

f ( x) s 1 π e 1 ( x s m) Denne forskrift skal du IKKE huske! En anvendelse af normalfordeling. Ved fremstillingen af en vare er der pç grund af tilfåldigheder stor forskel pç vågtene af varerne. VÅgtene er normalfordelt med spredning 1,5 gram. Varer der vejer under 3 gram skal kasseres. (Jo tungere varen er, jo dyrere er det at fremstille den). Opgave: Hvor stor en del af varerne skal kasseres hvis maskinen indstilles til at fremstille varer med middelvårdi 33 gram? Svar: Lad f våre funktionen der viser fordelingen af tal der er normalfordelt med middelvårdi m = 33 og spredning s = 1,5. Arealet under f-grafen i intervallet < x < 3 er 3 f ( x) dx 0,5 sç 5, % af varerne skal kasseres. Udregnet af Nspire. Opgave: Hvor stor en del af varerne skal kasseres hvis maskinen indstilles til at fremstille varer med middelvårdi 34,5 gram? Svar: Lad g våre funktionen der viser fordelingen af tal der er normalfordelt med middelvårdi m = 34,5 og spredning s = 1,5. Arealet under g-grafen i intervallet < x < 3 er 3 g( x) dx 0,048 sç 4,8 % af varerne skal kasseres. Udregnet af Nspire. Opgave: En ny maskine laver varer der er normalfordelt med spredning 1 gram. Hvor stor en del af varerne skal kasseres hvis maskinen indstilles til at fremstille varer med middelvårdi 33 gram? Svar: Lad h våre funktionen der viser fordelingen af tal der er normalfordelt med middelvårdi m = 33 og spredning s = 1. Arealet under h-grafen i intervallet < x < 3 er 3 h( x) dx 0,159 sç 15,9 % af varerne skal kasseres. Udregnet af Nspire. Statistik for gymnasiet og hf Side 016 Karsten Juul

-fordeling 3 -fordeling. Nogle tal er normalfordelt med middelvårdi 0 og spredning 1. PÇ figur 9 har vi tegnet nogle fç af disse tal som prikker. Disse fç af tallene har vi valgt sçdan at de giver et indtryk af hvordan alle tallene er fordelt. Hvert af tallene opléfter vi til anden: ( 0,6) 0,36,5 6,5 osv. De tal vi fçr pç denne mçde, er fordelt som antydet pç figur 10. Vi vil finde forskriften for funktionen g der viser hvordan disse tal er fordelt. (Kun fç af tallene er vist som prikker). Figur 9 f g Figur 10 g-grafen viser hvordan tallene fra 9.3 er fordelt, dvs. hvis vi mange gange tager en stikpräve og hver gang udregner, så vil vi få nogle tal der er fordelt som g-grafen viser. Da vi i afsnit 9 tog en stikpréve hvor χ 3, 60 p g( x) dx 0,058. 3,60 Her har vi brugt forskriften for g som stçr i linjen (9) i afsnit 5., kunne vi altsç have udregnet p sçdan: 4 Forskrift for g. f og g er funktionerne fra afsnit 3. Arealfunktionerne for f og g kalder vi F og G, dvs. F (x) = grçt areal pç figur 11 og G (x) = grçt areal pç figur 1. 1,0 0,5 0,5 Figur 11 Figur 1 F( x ) f G(x) g x x Tallene i intervallet 0 t x stammer fra tallene i intervallet x t x, sç grçt areal pç figur 1 = grçt areal pç figur 13 dvs. (1) G( x) C Af figur 11 og 13 ser vi at C F( x ) A. x A x 0,5 C x B f Figur 13 Statistik for gymnasiet og hf Side 3 016 Karsten Juul

Vi indsåtter dette i (1): () G( x) F( x ) A Da f-grafen er symmetrisk, er (3) G( x) F( x ) B A B, sç i () kan vi erstatte A med B: Hele arealet under f-grafen er 1, sç af figur 13 og 11 ser vi at B 1 F( x ). Dette indsåtter vi i (3): (4) G( x) F( x ) ( 1 F( x )) Vi reducerer (4) og fçr: (5) G( x) F( x ) 1 Da G er arealfunktion for g, er (6) g( x) G( x) Af (5) og (6) fçr vi (7) g( x) ( F( x ) 1) Nspire udregner héjresiden og fçr (8) x e g( x) x I rammen ses hvordan vi taster for at fç (8). Du skal IKKE kunne denne indtastning. Denne formel skal du IKKE huske! 5 -fordeling når antal frihedsgrader ikke er 1. Forskriften (8) omskriver vi til ( 9) 1 g( x) x e, x 0. π funktion viser fordelingen af tal der er -fordelt med 1 frihedsgrad. I (9) har x eksponenten Hver gang vi lågger 1 til eksponenten, bliver antallet af 1 frihedsgrader 1 stérre. Samtidig mç vi erstatte konstanten π med en anden konstant sç arealet under grafen stadig er 1. Hvis antallet af frihedsgrader er 4, sç er tåthedsfunktionen altsç af typen g( x) kxe Nspire léser ligningen e x k x dx 0 mht. k og fçr 1 k 4 1 x, sç 1 e x 1 x (10) g( x) x, x 0 4 er funktionen der viser fordelingen af tal der er -fordelt med 4 frihedsgrader. 1. 6 -fordeling og test. Figuren viser grafen for funktionen (10) fra afsnit 5. Hvis vi i en -test med 4 frihedsgrader fçr at er 6,8, sç er p lig det grç areal: p 1 xe dx 0,14684 6,8 4 Normalt regner vi dette tal ud sçdan: x p = χãcdf(6.8,, 4) = 0,14684 g Statistik for gymnasiet og hf Side 4 016 Karsten Juul

N1 Middeltal og kvartilsät ud fra kort liste Nspire-besvarelser N Middeltal og kvartilsät ud fra lang liste Statistik for gymnasiet og hf Side 5 016 Karsten Juul

N3 Middeltal og kvartilsät ud fra hyppighedstabel N4 Boksplot ud fra kort liste Statistik for gymnasiet og hf Side 6 016 Karsten Juul

N5 Boksplot ud fra lang liste N6 Boksplot ud fra hyppighedstabel Statistik for gymnasiet og hf Side 7 016 Karsten Juul

N7 Boksplot ud fra kvartilsät N8 Boksplot ud fra flere datasät Statistik for gymnasiet og hf Side 8 016 Karsten Juul

N9 Histogram Statistik for gymnasiet og hf Side 9 016 Karsten Juul

N10 Sumkurve ud fra antal, afläs Statistik for gymnasiet og hf Side 30 016 Karsten Juul

N11 Sumkurve ud fra procent Statistik for gymnasiet og hf Side 31 016 Karsten Juul

N1 Test for uafhängighed Statistik for gymnasiet og hf Side 3 016 Karsten Juul

N13 Test for uafhängighed, mm Statistik for gymnasiet og hf Side 33 016 Karsten Juul

N14 Test for fordeling, antal i stikpråve Statistik for gymnasiet og hf Side 34 016 Karsten Juul

N15 Test for fordeling, procent i stikpråve Statistik for gymnasiet og hf Side 35 016 Karsten Juul

Stikordsregister # -fordeling...3, 4 -test...19, 4, 3, 33, 34, 35 -test for fordeling, antal angivet...17, 34 -test for fordeling, procenter angivet..19, 35 -test for uafhångighed...13, 16, 3, 33 A alternativ hypotese...17 arealfunktion...3 B boksplot, sammenligne...4 boksplot, tegne...3, 6, 7, 8 D data...1 deskriptiv statistik...1 F faktiske tal i test for fordeling...17, 19 faktiske tal i test for uafhångighed...13, 16 forkaste hypotese...1, 14, 16, 18, 19 forventede tal i test for fordeling...17 forventede tal i test for uafhångighed...13, 16, 33 forventede vårdier...33 frekvens...6 frihedsgrader...19, 4 frihedsgrader i test for fordeling...18, 34, 35 frihedsgrader i test for uafhångighed...15, 16 G grupperede data...1, 5 gruppering af data...9, 10 H histogram...5, 10, 9 hypotese...1, 13, 16, 17, 19 I intervallers bredde...10 intervallers endepunkter...9 intervals frekvens...6 K kritisk vårdi...19 kumuleret frekvens...6, 30, 31 kumuleret hyppighed...6 kvartilsåt for grupperede data...8, 30 kvartilsåt for ugrupperede data...3, 5, 6 M median for grupperede data...8, 30 median for ugrupperede data..., 3, 5, 6 middeltal for grupperede data...9 middeltal for ugrupperede data...1, 5, 6 middelvårdi for grupperede data...9 middelvårdi for normalfordeling...1 middelvårdi for ugrupperede data...1, 5, 6 N nedre kvartil for grupperede data...8, 30 nedre kvartil for ugrupperede data...3, 5, 6 normalfordeling...1 normalfordeling, forskrift...1 nulhypotese...17, 3, 33, 34, 35 P p...11, 14, 16, 18, 19, 4, 33 population...11, 13, 16, 17, 33 S sandsynlighed...1 signifikansniveau...1, 16, 18, 19 skjult variabel...1, 33 spredning...1 stikpréve...11, 13, 16, 17, 33 sumkurve og lineår sammenhång...10 sumkurve, aflås...7, 8, 30 sumkurve, tegn nçr antal oplyst...6, 30 sumkurve, tegn nçr procent oplyst...6, 31 systematisk fejl...11, 33 T test af hypotese...1, 17, 19 test for fordeling, antal angivet...17, 34 test for fordeling, procenter angivet...19, 35 test for uafhångighed...13, 16, 3, 33 teststérrelse...14, 16, 17, 33 teststérrelse, stérste bidrag...17, 34 tilfåldig fejl...11 U uafhångig...17 ugrupperede data...1 Ä Évre kvartil for grupperede data...8, 30 Évre kvartil for ugrupperede data...3, 5, 6