MAteMAtik For LærerStUDerenDe



Relaterede dokumenter
MAteMAtik For LærerStUDerenDe

MAteMAtIk FoR LæReRStUDeReNDe. tal, algebra og funktioner klasse

MAteMAtIk FoR LæReRStUDeReNDe

WORKSHOP 2C, DLF-kursus, Krogerup, 26. november 2015

HANS CHRISTIAN HANSEN JOHN SCHOU KRISTINE JESS JEPPE SKOTT GEOMETRI MATEMATIK FOR LÆRERSTUDERENDE KLASSE

Statistik og sandsynlighedsregning

Simulering af stokastiske fænomener med Excel

Kompetencemål for Matematik, klassetrin

LÆRINGSMÅL PÅ NIF MATEMATIK

Når vi forbereder et nyt emne eller område vælger vi de metoder, materialer og evalueringsformer, der egner sig bedst til forløbet.

Lidt historisk om chancelære i grundskolen

Simulering af stokastiske fænomener med Excel

Matematik. Læseplan og formål:

forstå, arbejde med og analysere problemstillinger af matematisk art i sammenhænge, der vedrører dagligliv, samfundsliv og naturforhold

Fagårsplan 10/11 Fag: Matematik Klasse: 7.ABC Lærer: Henrik Stillits. Fagområde/ emne

Evaluering af matematik undervisning

Skolens formål med faget matematik følger beskrivelsen af formål i folkeskolens Fælles Mål:

Kapitlet indledes med en beskrivelse af - og opgaver med - de tre former for sandsynlighed, som er omtalt i læseplanen for

3. klasse 6. klasse 9. klasse

Elevmateriale. Forløb Statistik

Kompetencemål for Matematik, klassetrin

Årsplan for 2.kl i Matematik

Årsplan for 7. klasse, matematik

Matematik på Humlebæk lille Skole

Kompetencemål i undervisningsfaget Matematik yngste klassetrin

Selam Friskole Fagplan for Matematik

Kompetencemål for Matematik, klassetrin

Læseplan for faget matematik klassetrin

Undervisningsplan for matematik

Modellering med Målskytten

MATEMATIK. GIDEONSKOLENS UNDERVISNINGSPLAN Oversigt over undervisning i forhold til trinmål og slutmål

Matematik. Matematikundervisningen tager udgangspunkt i Folkeskolens Fælles Mål

Klassen er sammenlæst, altså 5 og 6 klasse på en og samme tid. Samtidig er klassen pt på ca 11 elever ialt.

Asbjørn Madsen Årsplan for 8. klasse Matematik Jakobskolen

Fælles Mål på tværs. Af Ingelise Moos og Karen Vilhelmsen

Læremiddelanalyser eksempler på læremidler fra fem fag

Fagårsplan 10/11 Fag: Matematik Klasse: 8.A Lærer: Henrik Stillits Fagområde/ emne Færdighedsregning - Typer af opgaver - Systematik

Matematiske kompetencer - hvad og hvorfor? DLF-Kursus Frederikshavn Eva Rønn UCC

Matematik i læreruddannelsen LÆRERUDDANNELSEN I FOKUS. Redaktion: Gorm Bagger Andersen Lis Pøhler

Space Challenge og Undervisningsminsteriets Fælles Mål for folkeskolen

MATEMATIK. Formål for faget

Årsplan i matematik for 9. klasse 2017/2018

Årsplan i matematik for 9. klasse 2018/2019

Fig. 1 Billede af de 60 terninger på mit skrivebord

Den mundtlige prøve i matematik og forenklede Fælles Mål Odense 20. April 2015

Matematik. Matematiske kompetencer

Årsplan for 5. klasse, matematik

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Introduktion

Oversigt over Forenklede Fælles Mål i forbindelse med kapitlerne i MULTI. Ræsonnement og tankegang. Modellering

Matematik samlet evaluering for Ahi Internationale Skole

Indblik i statistik - for samfundsvidenskab

Indhold. Bind 1. 1 Eksperimentel geometri 3. 2 Areal 33

Per Vejrup-Hansen Praktisk statistik. Omslag: Torben Klahr.dk Lundsted Grafisk tilrettelæggelse: Samfundslitteratur Grafik Tryk: Narayana Press

Undervisningsbeskrivelse

Oversigt over Forenklede Fælles Mål i forbindelse med kapitlerne i MULTI. Problembehandling. Modellering

Gennemsnit og normalfordeling illustreret med terningkast, simulering og SLUMP()

Årsplan for matematik

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Introduktion

Oversigt over Forenklede Fælles Mål i forbindelse med kapitlerne i MULTI. Problembehandling. Modellering

Faglige delmål og slutmål i faget Matematik. Trin 1

Matematik. Mål Aktiviteter Øvelser/Evaluering

Fagplan for faget matematik

Introduktion til sandsynlighedsregning

Hvad siger statistikken?

Lad os som eksempel se på samtidigt kast med en terning og en mønt:

Der er ikke væsentlig niveauforskel i opgaverne inden for de fire emner, men der er fokus på forskellige matematiske områder.

Undervisningsbeskrivelse

Årsplan 8. klasse matematik Uge Emne Faglige mål Trinmål Materialer/ systemer 33 og løbende

Undervisningsplan for faget matematik. Ørestad Friskole

{ } { } {( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )}

Årsplan for Matematik 8. klasse 2011/2012

Matematik og skolereformen. Busses Skole 27. Januar 2016

LÆRERUDDANNELSEN I FOKUS

Årsplan 8. Klasse Matematik Skoleåret 2016/17

Lars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ 2 -test og Goodness of Fit test.

UDVIKLING AF MATEMATIKFAGET

Årsplan for matematik

Årsplan matematik 5. klasse. Kapitel 1: Godt i gang

Matematika rsplan for 6. kl

Kort gennemgang af Samfundsfaglig-, Naturvidenskabeligog

Vejledning til forløbet: Hvad er chancen?

Årsplan 9. klasse matematik Uge Emne Faglige mål Trinmål Materialer/ systemer 33 Årsprøven i matematik

Emne Tema Materiale r aktiviteter

Årsplan matematik 7. Klasse

Vejledende læseplan Matematik

ÅRSPLAN MATEMATIK 2. KLASSE 2016/17 I

Undervisningsbeskrivelse

Matematika rsplan for 8. kl

Årsplan for matematik

Matematik. Tema: Brøker og procent Uge 33. Skoleåret 2019/20 Årsplan 9. Klasse. Mål Aktiviteter Øvelser/Evaluering.

MaxiMat og de forenklede Fælles mål

Matematik. Mål Aktiviteter Øvelser/Evaluering

LÆRERUDDANNELSEN I FOKUS

CMU PROJEKT HYPOTESETEST OG SIMULERING MICHAEL AGERMOSE JENSEN CHRISTIANSHAVNS GYMNASIUM

M A T E M A T I K FAGBESKRIVELSE FOR UNDERVISNING I MATEMATIK PÅ HARESKOVENS LILLESKOLE:

Undervisningsplan 3-4. klasse Matematik

Ypsilon er alfa og omega

Årsplan Matematrix 3. kl. Kapitel 1: Jubii

Introduktion til mat i 4 klasse Vejle Privatskole 2013/14:

Formativ brug af folkeskolens prøver årets resultater på landsplan Den skriftlige prøve i matematik med hjælpemidler, FP9 maj 2019

Transkript:

JOhN schou kristine JEss hans christian hansen JEppE skott MAteMAtik For LærerStUDerenDe stokastik 1. 10. klasse

Joh n Schou, Kristine Jess, Hans Christian Hansen og Jeppe Skott Matematik for lærerstuderende Stokastik 1.-10. klassetrin Samfundslitteratur

Joh n Schou, Kristine Jess, Hans Christian Hansen og Jeppe Skott Matematik for lærerstuderende Stokastik 1.-10. klassetrin 2013, Samfundslitteratur Omslag: Annette Borsbøl, Imperiet Tegninger: Joh n Schou Forlagsredaktion: Ole Jørgensen Projektledelse: Thomas Bestle Sats og tryk: Narayana Press, Gylling Printed in Denmark, 2013 Trykt bog ISBN 978 87 593 1798 3 E-bog ISBN 978 87 593 2334-2 Samfundslitteratur Rosenørns Alle 9 1970 Frederiksberg C Tlf. 3815 3880 Fax 3535 7822 www.samfundslitteratur.dk Alle rettigheder forbeholdes Kopiering af denne bog må kun finde sted på institutioner, der har indgået aftale med COPY-DAN, og kun inden for de i aftalen nævnte rammer. Undtaget herfra er korte uddrag til anmeldelser.

INDHOLD Forord 9 Indledning: Hvorfor stokastik? 11 Historien om stokastik 11 Stokastik i denne bog 15 1 Åben udforskende dataanalyse 17 Prøv selv at være datadetektiv 20 En start på modeller af 24 Elever som datadetektiver 27 Opsamling på kapitel 1 28 2 Beskrivende statistik 31 Diskrete data 32 Kontinuerte eller grupperede data 38 Deskriptorer i skolen 42 Hvilken klasse er bedst til matematik? 42 Elevers forståelse af gennemsnit 47 Mokros & Russells undersøgelse 47 Cobb og hans kollegers arbejde 53 Opsamling på kapitel 2 55 3 På sporet af sammenhænge 57 Genkendelse af lineær vækst i skolen 59 Cobb og hans kolleger om samvariation 63 At finde sammenhænge 67 Skab mening 73 Lineær regression 74 Ikke-lineære modeller 78 At finde sammenhænge mellem kategorivariable 80 Opsamling på kapitel 3 85 Indhold 5

4 Elementer af stokastikkens didaktik 87 Forforståelse og begrebsudvikling 87 Et eksempel på sandsynlighedsundervisning i den franske skole 89 Klasserumsundersøgelser af stokastisk tænkning 93 Elevers forventninger ved stikprøver 96 Elevers syn på variation ved gentagen stikprøve 99 At sætte læreren i elevens situation 100 Læreres støtte til elevers opbygning af et sandsynlighedsbegreb 102 Chernoff og Zazkis opfølgende undersøgelse 103 Opsamling på kapitel 4 105 5 Tre slags sandsynlighed 107 Kvalitative sandsynligheder 108 Børns kvalitative sandsynlighedsbegreber 109 Kvantitative sandsynlighedsbegreber 110 Subjektiv sandsynlighed 110 Det statistiske sandsynlighedsbegreb 112 Det kombinatoriske sandsynlighedsbegreb 117 Det fælles for det subjektive, det statistiske og det kombinatoriske sandsynlighedsbegreb 122 En matematisk indpakning: sandsynlighedsfeltet 125 Hvilket sandsynlighedsbegreb skal vi vælge i skolen? 128 Sandsynlighedsbegreber i Standards 2000 128 Erin en amerikansk elev i 6. klasse 130 Opsamling på kapitel 5 132 6 Kombinerede sandsynligheder, chancetræer og spil 133 Elevers forståelser af kombineret sandsynlighed 134 Den multiplikative lov i sandsynlighedsregning 136 Chancetræet og spil 140 En vifte af metoder til løsning af en enkelt elevopgave 144 1. Det konkrete eksperiment gentages 144 2. Det simulerede eksperiment 145 3. Teoretisk beregning baseret på hele tal, tælletræ 145 4. Teoretisk beregning under anvendelse af brøkbegrebet 147 6 Indhold

5. Chancetræer, teoretisk behandling under anvendelse af addition og multiplikation af brøker 148 Opsamling på kapitel 6 153 7 Sandsynlighedsfordelinger 155 Binomialfordelingen 156 Antallet af veje i et binært chancetræ 159 Beregninger med binomialfordelingen i praksis 163 Hypergeometrisk fordeling 164 Opsamling på kapitel 7 171 8 Stikprøver og estimation 173 Indledning om statistiske slutninger 173 Stikprøver 174 Almenmenneskelige fejltolkninger 175 Estimation eller kunsten at gætte et tal 177 Systematiske fejl 180 Tilfældige fejl 181 Simulering 183 En regel for beregning af usikkerheden for et estimat 185 Forøget stikprøve giver mindre usikkerhed på estimatet 186 Opsamling på kapitel 8 189 9 Hypotesetest 191 Eksempler på statistiske test 193 Acceptmængde, kritisk mængde og fejl af 1. og 2. art 197 Hvor godt passer data? 204 Opsamling på kapitel 9 213 Afsluttende undersøgelser 215 Referencer 221 Bøger til grundskolen 224 Stikordsregister 225 Indhold 7

FORORD Matematik for lærerstuderende har, siden det vandt lærebogsprisen i 2006, været et udbredt system for linjefagene i matematik på læreruddannelserne i Danmark, og de centrale bøger i systemet er oversat til svensk. Udgangspunktet i 2006 var meget ambitiøst på grund af det nye store timetal i matematik. I anledning af den seneste reform LU13 er omfanget reduceret, men det høje ambitionsniveau er fastholdt, hvad angår de kvalifikationer, der retter sig mod den lærerstuderendes fremtidige profession. Til undervisningsfaget matematik 1.-6. klasse er der i vores system følgende bøger: Tal, algebra og funktioner 1.-6. klasse; Geometri 1.-6. klasse; Stokastik 1.-10. klasse; Delta, Fagdidaktik; My, Elever med særlige behov. Til undervisningsfaget matematik 4.-10. klasse er der følgende bøger: Tal, algebra og funktioner 4.-10. klasse; Geometri 4.-10. klasse; Stokastik 1.-10. klasse; Delta, Fagdidaktik; My, Elever med særlige behov. Til den studerende, der føler behov for at opdatere sin faglighed inden studiestart, har vi udviklet materialet Alfa, Forstudier. Der er naturligvis et overlap mellem indholdet i de to specialiseringer, der forbereder fremtidens matematiklærere i grundskolen. Selv om de faglige videns- og færdighedsmål inden for stokastik er lidt forskelligt formuleret for de to specialiseringer, har vi skønnet, at en samlet fremstilling af feltet er den bedste måde at formidle indholdet på. Det må så afhænge af en lokal prioritering baseret på LU13 og den lokale studieordning, hvilke kapitler man vil lægge særlig vægt på i hver specialisering. I den forbindelse kan vi oplyse, at kapitel 9 om hypotesetestning bygger på kapitel 7 om fordelinger, mens kapitel 8 om estimation ikke forudsætter kapitel 7. I hvert kapitel er de vigtigste mål angivet i starten, og kapitlet rundes af med en opsamling, der muliggør en evaluering af udbyttet. De matematiske kompetencer står centralt både i LU13 og i det aktuelle faghæfte for grundskolen, derfor fremhæver vi i hvert kapitel, hvilke kompetencer der især kan udvikles gennem arbejdet. Den studerende vil gennem arbejdet med de tre Forord 9

matematikfaglige bøger være kommet godt omkring alle otte matematiske kompetencer. Programmel, it Vi inddrager i høj grad it, og vi benytter gratis og frit tilgængelige ressourcer, som også i vid udstrækning er platformsuafhængige. Simulering af sandsynligheder i forbindelse med fx terningekast kan foregå i regneark eller GeoGebra. For at simulere en række andre typer af sandsynlighed er det en fordel, hvis man kan simulere kugleudtrækninger. Til dette formål anbefaler vi Kugle123 fra det nu nedlagte INFA-projekt ved Danmarks Pædagogiske Universitet. Programmet kan stadig hentes på hjemmesiden infa.dk under programmel chancelære. Kugle123 er lidt gammeldags og kører a priori kun under Windows. Hvis man benytter Mac- eller Linuxcomputere, kan man dog få programmet til at køre, hvis man installerer det under det gratis virtualiseringsprogram Wine 1. Måske forekommer det lidt besværligt, men alternativet er, at man ikke på en nem måde kan simulere sig til en række vigtige forståelser om tilfældighed og chance. Der findes svarforslag til udvalgte opgaver på bogens hjemmeside www. samfundslitteratur.dk/mat ligesom en liste over de trykfejl, vi bliver opmærksomme på, vil være at finde på denne hjemmeside under errata. København, maj 2013 Joh n Schou, Kristine Jess, Hans Christian Hansen og Jeppe Skott 1 http://www.winehq.org Lokaliseret marts 2013. 10 Forord

INDLEDNING: HVORFOR STOKASTIK? Vi er ofte optaget af ting, hvor der er et stort eller lille moment af usikkerhed eller tilfældighed. Det er vi fx, når vi spørger: 1) Gad vide, hvor længe man skal vente på bussen her. 2) Hvem vinder valget næste gang? 3) Mon FCK slår Brøndby i fodboldkampen på søndag? 4) Er det farligere at flyve end at køre i bil? 5) Hvis vi får atomkraft i Danmark, hvad er så sandsynligheden for, at vi får et stort uheld, ligesom de fik i Japan. 6) Hvad er chancen for, at jeg tipper en trettener? 7) Kan jeg være sikker på, at denne terning inden for de næste seks slag vil vise mindst én sekser? Statistikker over fortidens erfaringer på det konkrete felt kan nogle gange hjælpe os til et svar. Sandsynlighedsregning kan specielt i forenklede situationer direkte fortælle, hvad sandsynligheden er for forskellige fremtidige hændelser. Fremtiden er dog grundlæggende ukendt og ukontrollabel, selvom man kan prøve at forsikre sig mod forskellige uheld og ulykker. Det er netop derfor, forsikringsselskaberne bruger gode statistikker og modeller til at beregne risikoen for, at det går galt for mange mennesker på samme tid, da det ellers er forsikringsselskabet, det går galt for. HISTORIEN OM STOKASTIK Inspireret af nyere didaktisk forskning i emnerne statistik og sandsynlighedsregning har vi valgt at kalde denne bog Stokastik. Det gør vi for at Indledning: Hvorfor stokastik? 11

sende et signal om det tilrådelige i at behandle de to emner i sammenhæng i skolen, hvilket er i modsætning til den måde, de blev behandlet på, da de først blev introduceret i læreruddannelsen i slutningen af 1960 erne og i skolen i 1970 erne. Dengang var de i realiteten delt i to: beskrivende statistik og sandsynlighedsregning. Udviklingen mod en samlet tilgang til området skyldes omfattende erfaringer med, at en opdeling i en kombinatorisk baseret sandsynlighedsregning og en isoleret deskriptiv statistik for mange elevers vedkommende fører til, at de får problemer med begge emneområder og især med sammenhængen mellem dem. I en beskrivelse af historien om statistik og sandsynlighedsregning som skolefag fremhæver Burrill & Biehler tyskeren Heitele som pioner, fordi han allerede i 1975 indførte betegnelsen stokastisk undervisning for feltet med statistik og sandsynlighedsregning. De finder sammentænkningen vigtig, da man aldrig ved en begrænset stikprøve kan nå frem til en sikker teoretisk sandsynlighed, og da empiriske data i det hele taget kan lede til forskellige sandsynlighedsmodeller. De fortsætter: Probability should not be taught data-free but with a view towards its role in statistics og Data analysis should not be taught completely model-free but with a view towards theoretical distributions and underlying processes. (Burill & Biehler, 2011, s. 60 f.). I en dansk sammenhæng har Lars Rasmussen (fx i sin ph.d.-afhandling fra 1987) og Malmberg (bl.a. i sit mangeårige arbejde med Infa-projektet 1, der anvendte begrebet chancelære ) slået til lyd for lignende tanker. Rasmussen kritiserer det, han kalder traditionel undervisning i statistik og sandsynlighedsregning for en række svagheder. Han konkluderer, at resultatet af en opdeling i en formel kombinatorisk tilgang til sandsynligheder og et arbejde i statistik, præget af træning af standardteknikker, bliver en ubrugelig kombinatorik, en betydningsløs og kedelig statistik og en anvendelsesfattig sandsynlighedsregning (ibid., s. 134). I stedet foreslår han, at eleverne sættes i en undersøgende og forskningslignende arbejdssituation, hvor de skal arbejde med frekvensfølgers stabilitet i forbindelse med lange dataserier fra samme gentagne eksperiment og med usikkerhedsintervaller i stikprøver. I tidsskriftet Matematik skrev han allerede i 1985 (Rasmussen, 1985, s. 6 f.): 1 www.infa.dk 12 Indledning: Hvorfor stokastik?

Man skelner mellem kombinatorisk sandsynlighed og statistisk sandsynlighed (frekventiel sandsynlighed). De kombinatoriske sandsynligheder bygger på udfaldsrum og ligevægtede udfald Grundlaget for de statistiske sandsynligheder er derimod serier af praktiske eksperimenter. Når man i en undervisning vil bygge på barnets intuitive sandsynlighedsbegreb, bør man være opmærksom på, at det netop er i kontakten med dets omverden, det har erhvervet et sandsynlighedsbegreb. Da de kombinatoriske sandsynligheder (for f.eks. mønt- og terningekast og kugleudtagelser) har meget begrænsede anvendelsesmuligheder, er de sandsynligheder, der anvendes i den omverden, barnet lever i, af overvejende statistisk art. Det centrale og dermed væsentligste element i en undervisning, der forsøger at bygge på intuition for sandsynlighed, er derfor det statistiske sandsynlighedsbegreb. Dette syn slår kun delvis igennem i det næste faghæfte (1995) for folkeskolens matematikundervisning, hvor statistik og sandsynlighedsregning forsvinder som selvstændigt fagligt hovedområde, men genfødes bl.a. under Matematik i anvendelse. I et kritisk, lidt ironiserende tilbageblik på 95-faghæftet skrev Malmberg (2002): Eleverne skal altså gennem undervisningen komme frem til at opnå færdigheder i at forholde sig til sandsynligheder. Nu kan eleverne ikke bare forholde sig til noget uden at have et udgangspunkt at forholde sig ud fra. Uden en basis at støtte sig til bliver det rent dilettanteri at forholde sig til en sag. Man kan frygte at dette vil blive realiteten i skolens forhold til sandsynligheder, idet der ikke i de vejledende læseplaner i faghæftet gives opfordringer eller retningslinjer til at opbygge et fagligt fundament, hvorfra eleverne kan foretage deres overvejelser. Ej heller er der i undervisningsvejledningen nogen støtte at hente for den lærer der ønsker at få læseplansudvalgets bud på hvordan undervisningen i dette fagområde kan tilrettelægges. Sandsynlighedsregning har ikke fået et eneste lille afsnit blandt vejledningens mange sider. Undervejs i faghæftet kan man læse, at vægten lægges på det statistiske sandsynlighedsbegreb, men der gives ikke en nærmere forklaring på hvad denne betegnelse står for. (Ibid., s. 14 f.) Indledning: Hvorfor stokastik? 13

I øvrigt har Malmberg samme kritik af de første faghæfter efter årtusindeskiftet. I USA kom statistik med som et selvstændigt område i NCTM s 2 Standards (1989) og med et klart budskab om fusion med sandsynlighedsregning. En af de amerikanske pionerer på feltet, M. Shaugh nessy, skrev i sit kapitel om sandsynlighedsregning i A Research Companion (2003): Skønt dette kapitel fokuserer på sandsynlighedsregning, må jeg understrege, at adskillelsen af statistisk og sandsynlighed er lige så kunstig i den didaktiske forskning som adskillelsen af data og chance er i skolen (ibid., s. 216, vores oversættelse). Shaugh nessy udtrykker altså samme opfattelse som Rasmussen og Malmberg af det kunstige i at adskille statistik og sandsynlighedsregning. Efter en kort oversigt over den omfattende litteratur på feltet slutter han sit kapitel af med fem anbefalinger til undervisningen i stokastik, som han mener kan bidrage til at overkomme de nævnte problemer (Shaugnessy, 2003, s. 223 f.). Den første anbefaling er den enkle, at man skal starte tidligt og blive ved i hele skoleforløbet. Den anden er, at der skal lægges vægt på begrebet udfaldsrum: Hvad er overhovedet muligt som resultat af dette eksperiment? De to næste anbefalinger er, at sandsynlighedsregning og statistik skal behandles som ét område, stokastik, og at udgangspunktet skal være i statistikken, hvor resultaterne i et datasæt bliver til udfaldsrummet, og hvor frekvenser fortolkes som sandsynligheder. Herved bliver det muligt at vurdere virkelighedens mere komplekse risici, fordi man ikke er begrænset til at beskæftige sig med så simple situationer som dem, hvor alle udfald skal være lige sandsynlige. Endelig foreslår Shaugh nessy, at elevernes egne stokastiske projekter skal være udgangspunkt for undervisningen. Shaugh nessy er ikke alene om anbefalinger af den slags. Konold m.fl. (2011, s. 83) skrev, at der er en risiko for, at når eleverne har arbejdet for meget med at bestemme teoretiske sandsynligheder i symmetriske situationer, hvor de fra starten kender denne sandsynlighed, så giver det ikke mening for dem på anden vis at slutte sig til, hvad der kan være sandsynligt i det 2 Den internationalt anerkendte amerikanske matematiklærerforening, The National Council of Teachers of Mathematics. 14 Indledning: Hvorfor stokastik?

aktuelle tilfælde. Når de senere skal undersøge data fra virkeligheden, hvor sandsynlighederne for de enkelte udfald sjældent er lige store, må de finde på andre metoder til drage en slutning, og disse elever vil ifølge forfatterne undre sig over, hvorfor de nogensinde skulle kæmpe med kombinatorik og sandsynlighed. Biehler m.fl. (2013) konkluderer, at statistisk kompetence bygger på et samvirke mellem såvel personlige anlæg som forskellige vidensbaser, herunder en særlig statistical literacy sammen med viden om statistik, matematik og om verden i almindelighed. I øvrigt finder vi det interessant og påfaldende, at mange anerkendte forskere inden for feltet har skrevet en artikel eller en bog om enten emnet statistik eller om emnet sandsynlighedsregning med en tilføjelse om, at man bør undervise i de to emner i en sammenhæng. STOKASTIK I DENNE BOG Det er lettere sagt end gjort at undervise i stokastik som et samlet emne, og det er endnu sværere at holde statistik og sandsynlighedsregning sammen i alle kapitler i en lærebog. Det, der taler for en adskillelse, er dels, at det så bliver muligt at præsentere delteorier systematisk og i logisk progression, og dels at denne tradition er indarbejdet hos flere af vores læsere. Billedet af stokastik som et sammenhængende emne i elementære fremstillinger lykkes nok bedst med samlinger af spændende data at udforske. Det skete, så vidt vi ved, første gang i det amerikanske lærebogssystem Statistics by example fra 1973, der dog ikke for alvor formåede at flytte den veletablerede tradition med teoretisk sandsynlighedsregning som det dominerende fag, skønt en samlet række af ledende statistikere, didaktikere og praktikere fra lærerforeningen NCTM var repræsenteret i forskningen bag systemet. Vi har i nærværende bog søgt at levere et godt og reflekteret kompromis. Lige efter denne indledning kan læseren med kapitlet Åben udforskende dataanalyse afprøve sig selv som datadetektiv. Og det sker vel at mærke uden at være blevet belæsset med nogen speciel teoretisk viden eller særligt velegnede værktøjer. Det kan være lidt frustrerende for den, der har fundet velbehag i en matematikundervisning, hvor man først fik værktøjerne og Indledning: Hvorfor stokastik? 15

så fik lov at øve dem, men tilgangen uden specialværktøjer giver en særlig oplevelse af statistik som et levende felt. Vi erkender dog fordelene ved at gå mere systematisk til værks, og det sker i kapitel 2 og 3 om beskrivende statistik. Vi knytter i videst mulig omfang den relevante stofdidaktik sammen med stoffet i de enkelte faglige kapitler, men indføjer et kapitel om stokastikkens didaktik. I kapitel 5, 6 og 7 følger vi i et vist omfang princippet om det opdelte stokastikfag, idet kapitlerne overvejende drejer sig om sandsynlighed med hovedvægten på det statistiske sandsynlighedsbegreb. Vi har nedprioriteret det kombinatoriske sandsynlighedsbegreb i så høj grad, at vi ikke har et kapitel om kombinatorik med 3. Ved at gøre dette kan man komme i klemme med at formulere og bevise formler for nogle vigtige sandsynlighedsfordelinger. Vi beviser dog formlen for binomialfordelingen, mens beviset for den såkaldte hypergeometriske fordeling i stort omgang overlades til læseren. Med dette grundlag tillader vi os at bygge på de indbyggede sandsynlighedsfordelinger i regneark og GeoGebra. Disse værktøjer er en forudsætning for, at vi i kapitel 8 og 9 kan udleve idealet om et forenende stokastikfag i kapitlet om hypotesetestning. Sammenhængen mellem beskrivende statistik og sandsynlighed er også klar og uundværlig i tilrettelæggelse og forståelse af opinionsundersøgelser. Dette felt hedder estimation inden for stokastikken, og vi har vi prøvet at beskrive det uden at bygge på teoretiske fordelinger, idet vi baserer det hele på forholdsregning og simuleringer fx på en computer. Hermed mener vi, at vi får fremstillet estimation som noget, det vil være muligt at arbejde med på grundskolens sidste trin. Som afslutning på stokastikbogen får læseren mulighed for at opleve andre aspekter af fagets rolle i samfundet ved at arbejde med tre undersøgelser, der kommer vidt omkring i hele stokastikkens spændende felt. 3 Vi har dog lagt et kapitel om kombinatorik på bogens hjemmeside for dem, der savner dette stof. 16 Indledning: Hvorfor stokastik?

1 ÅBEN UDFORSKENDE DATAANALYSE Meningen med deskriptiv statistik er at samle og bearbejde relativt store mængder af oplysninger om en situation præget af tilfældighed, så nogle relativt få, men centrale aspekter, udviklinger eller sammenhænge i den pågældende situation træder frem. I mange år var den dominerende tanke i undervisningen i dette felt, at eleverne skulle blive dus med nogle få velegnede værktøjer til at synliggøre sådanne aspekter og sammenhænge i datamaterialet. Og dette er stadig god undervisning. Det bliver imidlertid problematisk, hvis værktøjerne bliver det endegyldige mål, og færdighederne i brugen af værktøjerne bliver det eneste, der bliver lagt vægt på. Det kan i grundskolen dreje sig om at beregne et middeltal, en median, en kvartilafstand eller at lave et frekvensdiagram, et sammenknytningsdiagram eller en sumkurve, og senere i uddannelsesforløbet om sandsynlighedsfordelinger, estimationsteori og hypotesetestning. Det er altsammen vigtigt, men mest må det dreje sig om at blive i stand til at finde centrale aspekter, udviklinger og sammenhænge i et datamateriale med alle de midler, man har til rådighed, herunder først og fremmest et kritisk og kreativt blik på de foreliggende data. Man kan nå langt ved at stille de rette spørgsmål til data og sætte data op som simple grafer i fx stolpediagrammer og sammenknytningsdiagrammer. Hvis man skal udpege en enkeltperson som ophavsmand til idéen om at opspore mønstre og formulere hypoteser på baggrund af tendenser i data, uden straks at gribe til statistikkens kendte redskaber, må det være statistikeren Joh n Tukey (1915 2000). Hovedidéen bag det, han kaldte exploratory data analysis udforskende dataanalyse var, at dataindsamling ikke bare skal benyttes til at teste på forhånd opstillede hypoteser, men også til at udforske netop de foreliggende data for evt. at finde nye sammenhænge 1 Åben udforskende dataanalyse 17

og mulige hypoteser. På skoleområdet var lærebogsmaterialet Statistics by example, initieret af Joint Committee on the Curriculum in Statistics and Probability med deltagelse fra NCTM og skrevet af Mosteller m.fl. (1973) først ude med titler som bind I: Exploring Data. Hvis skolens statistikundervisning skal drejes i den retning af fordomsfri udforskning af data, er det vigtigt, at en kommende matematiklærer prøver det på egen krop, og det er hovedformålet med dette kapitel. Læseren skal selv prøve at være datadetektiv. Nogle eksempler kan være isolerede i modsætning til andre, der netop kan være eksemplariske, idet arbejdet med dem kan føre til udvikling af mere generelle værktøjer. Vi vil i dette kapitel kun starte denne udfoldelsesproces i det små, idet mange af idéerne tages op i de følgende kapitler. Vi indleder med et eksempel som introduktion til området ved at se på en undersøgelse af Cobb m.fl. (2003). De påviser, at det, der i fagsproget hedder et boxplot 1, kan opstå som resultatet af et længere undervisningsforløb, hvor eleverne udvikler en fælles praksis. Læreren kunne i stedet være gået direkte til boxplots og have undervist i dem fra starten. Men det ville disse elever i 7. klasse formodentlig have oplevet som endnu et teknisk krav ud over de andre graftyper og beregninger, de skal lære. Det kunne rykke deres opmærksomhed væk fra det mest interessante, nemlig analysen af alle trin i dataindsamlings- og behandlingsprocessen. Forsøget viser, at et standardredskab i deskriptiv statistik, et boxplot, kan vokse ud af et forløb, der vægter elevernes ræsonnementer over den samlede databehandlingsproces, dvs. over: Den indledende proces, hvor et problem beskrives og det spørgsmål, man gerne vil have besvaret, formuleres og diskuteres: Er der formuleret et spørgsmål med rimelighed og relevans i forhold til det oprindelige problem? Den fase, hvor indsamlingen af data planlægges og gennemføres: Hvordan operationaliseres spørgsmålet, så det kan gøres til genstand for statistisk 1 Et rektangel illustrerende bl.a. nedre kvartil, median og øvre kvartil (se også side 41). Der findes et eksempel på boxplot i skolesammenhæg i Sparre & Pedersen (2005). Flexmat, Tal og chancer 7.-9. klasse på s. 12 13. 18 STOKASTIK

behandling, og hvordan indsamler man data og skaber et første overblik over det? Den undersøgelse, Cobb m.fl. gennemførte, eksemplificerer, at elever i kraft af samarbejde i en klasse kan udvikle forståelser og metoder, så de opnår et mere kvalificeret grundlag for at ræsonnere om data. Disse forståelser og metoder får i første omgang karakter af modeller af de situationer, der arbejdes med. De kan evt. senere udvikle sig til at blive modeller for andre tilsvarende situationer 2. Læseren får i dette kapitel selv lejlighed til at skabe nogle modeller af nogle data og problemstillinger, før vi i senere kapitler støtter læseren i at omdanne sådanne modeller af til modeller for forskellige situationer. Det er målet, at læseren efter arbejdet med kapitlet har: Oplevet at have været i stand til at få data til at give mening. Erfaret, at det sommetider ikke er avanceret matematik, der er brug for, men simpel forholdsregning og simple grafer samt viden om den sag, der undersøges. Erfaret, at man kan udvikle en model af et givet datasæt, der siden kan udvikles til modeller for analyser af lignende datasæt. Opnået et grundlag for at udvikle lignende forløb til elever på skolens forskellige klassetrin. 2 Ved model af forstås en model, der er udviklet til at klare et specifikt problem eller en særlig situation. En sådan model kan måske udvikles og forfines mhp. generalisering og kan således blive en model for, dvs. en model, der er egnet til at behandle lignende problemstillinger. Læs mere om modeller af og modeller for i kapitel 15 i Tal, algebra og funktioner 1.-6. klasse eller i kapitel 15 i Tal, algebra og funktioner 4.-10. klasse. 1 Åben udforskende dataanalyse 19

Konklusion Fortolkning og konklusion. Nye ideer, kommunikation. Problem Forstå og definer problemet. Redefiner evt. problemet. Analyse Udforskning af data. Bearbejdning. Opstilling af hypoteser. Plan Planlæg følgende trin. Gennemfør eventuelt en mindre pilotundersøgelse. Overvej forhold vedrørende stikprøveudtagning. Data Lokalisering og indsamling af data. Rensning af data. Figur 1. Datadetektivens cyklus (efter inspiration fra Wild & Pfannkuch, 1999). PRØV SELV AT VÆRE DATADETEKTIV Hvis det skal være den ægte vare, omfatter professionen som datadetektiv, at man gennemgår hele cyklussen i figur 1 helst flere gange i forbindelse med det enkelte problem, der skal løses. Den blev anvendt i 1994 af MacKay & Oldford og videreudviklet hos Wild & Pfannkuch (1999). Den bliver fortsat fremhævet som meget væsentlig af MacGillivray & Pereira-Mendoza (2011, s. 110 ff.). De understreger det vigtige i at inddrage alle led i cyklussen: identificere problemet, planlægge undersøgelsen, indsamle data og endelig fortolke resultatet af analysen. I analysefasen forekommer det ofte, at der synes at være en sammenhæng mellem to variable i undersøgelsen, men at der alligevel ikke er en årsagssammenhæng mellem dem (se nærmere s. 71 i kapitel 3). Det er her, det bliver afgørende, at man kan opstille alternative hypoteser, fx finde en tredje faktor eller en fælles årsag. De fleste begreber i datadetektivens cyklus vil være læseren bekendt fra tidligere undervisning, men rensning af data er nok noget nyt. I sin simpleste udgave drejer det sig om at kassere fejlagtige data som fx sjuskede, åbenlyst forkerte aflæsninger. Udtrykket rensning indebærer dog det, at man ofte vil beholde data. Det kan være, at de bare skal harmoniseres, hvis fx en elev 20 STOKASTIK

er kommet til at måle længder med den forkerte side af tommestokken, så skal tommer oversættes til centimeter for at rense data. Men sommetider må man også kassere en måling som fx i en 8. klasse, hvor vi har oplevet et spontant tilfælde af datarensning, idet nogle elever skulle undersøge sammenhængen mellem længde og bredde af æg. De kasserede straks et stærkt afvigende æg med dommen: Det er en mutant. For at få et retvisende indtryk af hele processen i figur 1 bør man prøve det nogle gange. Det vigtige i den forbindelse er at bruge tid på punkterne problem og plan og ikke bare kaste sig ud i at måle forskelligt for at se, om der skulle være nogle interessante sammenhænge. I de følgende øvelser lægges op til, at læseren forsøger sig som datadetektiv uden at have været igennem den teori, der følger i de næste kapitler. Øvelse 1 I kriminalsager må man ofte ud fra visse spor slutte sig til noget om gerningsmanden. Fx vil man gerne ud fra et fodaftryk kunne sige noget om gerningsmandens omtrentlige højde og vægt. Tilrettelæg en undersøgelse, der belyser problemstillingen ved at gennemføre et forløb i cyklussen i figur 1. Øvelse 2 Vælg et af følgende tre problemer. Aftal, hvordan en autentisk undersøgelse med fx matematikholdet som forsøgspersoner kan forløbe i overensstemmelse med cyklussen i figur 1. Brug god tid på problem og plan. 1) Er prisen på kaffe i kantinen rimelig? 2) Hvor gammel er en lærerstuderende? 3) Mon folk, der går senere i seng, generelt får færre timers søvn om natten? 1 Åben udforskende dataanalyse 21

Øvelse 3 I Yellowstone National Park i USA findes en gejser, der kaldes Old Faithful, fordi turisterne altid kan regne med, at den udsender sin vandstråle mindst én gang under deres besøg på stedet. Men man kan dog godt komme til at vente en del minutter, som det fremgår af tabel 2 over tiden i minutter fra ét udbrud til det næste. Beskriv talmaterialet med henblik på at skrive et afsnit i en brochure om gejseren. Dag 1 51 82 58 81 49 92 50 88 62 93 56 89 51 79 58 82 52 88 Dag 2 86 78 71 77 76 94 75 50 83 82 72 77 75 65 79 72 78 77 Dag 3 65 89 49 88 51 78 85 65 75 77 69 92 68 87 61 81 55 93 Øvelse 4 Østerby og Vesterby har begge fodboldhold, der spiller med i en regional turnering. Deres målstatistik mod de øvrige hold i tilfældig rækkefølge er: Østerby mod andre hold: 4 1, 2 2, 1 3, 3 3, 2 4, 5 1, 3 4, 1 2, 2 2, 3 4 Vesterby mod andre hold: 2 4, 3 2, 1 1, 1 0, 1 1, 3 2, 4 5, 5 4, 3 1, 2 2 Beskriv de to holds præstationer i turneringen. Hvordan tror du, de vil klare sig i deres indbyrdes kamp? Øvelse 5 1) Seks gange sikrere I det forløbne år druknede 35 personer ved bådulykker. Kun 5 af dem bar svømmevest; ingen af de andre gjorde det. Bærer De selv svømmevest, når De er ude at sejle? Stil kritiske spørgsmål til denne annonce, der har været trykt i en svensk avis (her efter Dewdney, 1994, s. 65). Er der brug for supplerende data? 22 STOKASTIK

2) Risikosamfundet I februar 1990 trak mineralvandsfirmaet Perrier tusindvis af flasker ud af markedet, fordi de var blevet forurenet med en lav koncentration af det kræftfremkaldende stof benzol. Risikoen ved at drikke det forurenede vand afhænger af, hvor meget man drikker pr. dag. På grafen i figur 2 (Dewdney, 1994, s. 135) er angivet, hvor stor risikoen er over et helt liv for at dø af kræft ved forskelligt dagligt indtag af det forurenede vand. Skriv på den baggrund en lille notits til en avis om problemet. Øget sandsynlighed pr. menneskeliv 0,00012 0,00010 0,00008 0,00006 0,00004 0,00002 Kræftdødelighed 20 40 60 80 100 120 140 Figur 2. Dagligt indtag i liter Undersøgelse 1 Datadetektiven som kratlusker Kratlusker kom ind i sproget efter, at Danmark fik en miljøbeskyttelseslov i 1973. Det er en betegnelse for en særlig ivrig og engageret miljøforkæmper, der synes, at informationen om og tilsynet med forurening og andre miljøproblemer er for sparsom, og som derfor fx gemmer sig i et krat nær en kemisk virksomhed for med egne øjne at se, hvad der lukkes ud i atmosfæren, åen eller fjorden. I dag er det noget nemmere at være kratlusker ved blot at være datadetektiv på internettet, men statistik kan som bekendt være fejlagtig, og så er krattet stadig en alternativ mulighed for førstehåndsinformation. Prøv det med selvvalgt fokus. Eller forsøg med nogle afprøvede øvelser: 1) Undersøg, om det er rigtigt, at vi er ved at drukne i affald. Dvs. er affaldsmængden vokset over den seneste snes år? Hvor meget affald har vi været i stand til at bruge til noget mere fornuftigt end blot at grave ned eller deponere, som det teknisk kaldes? 1 Åben udforskende dataanalyse 23

Først skal man overveje, hvor man vil søge statistiske data om sagen. Hvis man prøver Miljøstyrelsen, kan man søge videre på en database, der hedder ISAG, og her finde tal for affald. Prøv det fx ved at søge på Statistikker og ISAG-dataudtræk. Vær datadetektiv ved at bearbejde data og evt. omdanne dem til grafer eller procenter, og besvar på det grundlag undersøgelsesspørgsmålene ovenfor. 2) Kortlæg jordforureningen i nærheden af dit uddannelsessted eller din private bolig. Miljøportalen.dk er måske den mest naturlige tilgang til miljødata af denne type. Gå ind på den og klik på data om miljøet i Danmark for at få et Danmarkskort frem. Dine videre valg styres nu via den lille grønne knap Her kan jeg. Vælg tænde/slukke lag og tjek ind i feltet jordforurening, klik på feltet og på uendelig, hvorefter du kan zoome ind på kortet, indtil du kan se farver svarende til forskellig jordforurening. Jo længere du zoomer ind, jo flere detaljer får du med. Hvis du vil have en bedre introduktion til mulighederne i miljøkortet, kan du finde en ved at klikke på korte introduktionsfilm. 3 EN START PÅ MODELLER AF Undervejs i arbejdet med de næste tre øvelser skal I være opmærksomme på, at I efterfølgende skal vurdere, om de fortolkninger og fremstillinger, I er nået frem til, udelukkende kan betragtes som en model af de foreliggende data, eller om de kan videreudvikles til en model for beskrivelse af lignende datasæt. 3 Det, datadetektiven kan lære af de foregående undersøgelser, er, at ofte er data faktisk let tilgængelige og passende bearbejdet og formidlet, men man bliver nødt til at sætte sig lidt ind i fagligheden på det undersøgte felt, det være sig affaldshåndtering eller jordforurening. Man lærer også, at man kommer langt med ret elementær matematik og grafik, hvis man i øvrigt er opmærksom og eftertænksom og har evne og personlighed til at spørge ind til substansen i sagen. 24 STOKASTIK