F I N N H. K R I S T I A N S E N KUGLE SIMULATIONER MÅLSCORE I HÅNDBOLD G Y L D E N D A L



Relaterede dokumenter
F I N N H. K R I S T I A N S E N KUGLE SIMULATIONER G Y L D E N D A L

Simulering af stokastiske fænomener med Excel

Allan C. Malmberg. Terningkast

Fig. 1 Billede af de 60 terninger på mit skrivebord

Simulering af stokastiske fænomener med Excel

Hvad er meningen? Et forløb om opinionsundersøgelser

Statistik og sandsynlighed

Gennemsnit og normalfordeling illustreret med terningkast, simulering og SLUMP()

Tip til 1. runde af Georg Mohr-Konkurrencen Kombinatorik

Mattip om. Statistik 2. Tilhørende kopier: Statistik 3, 4 og 5. Du skal lære om: Faglig læsning. Chance og risiko. Sandsynlighed

Mikro-kursus i statistik 1. del Mikrokursus i biostatistik 1

Taldata 1. Chancer gennem eksperimenter

Statistik. Peter Sørensen: Statistik og sandsynlighed Side 1

Kapitlet indledes med en beskrivelse af - og opgaver med - de tre former for sandsynlighed, som er omtalt i læseplanen for

Statistik og sandsynlighedsregning

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Allan C. Malmberg LÆR OM CHANCER! Sanne og Malene går på opdagelse med computeren

Personlig stemmeafgivning

Temaopgave i statistik for

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Normalfordelingen og Stikprøvefordelinger

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning

Lidt historisk om chancelære i grundskolen

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Statistik viden eller tilfældighed

Deskriptiv statistik. Version 2.1. Noterne er et supplement til Vejen til matematik AB1. Henrik S. Hansen, Sct. Knuds Gymnasium

Hvad siger statistikken?

Produkt og marked - matematiske og statistiske metoder

Regnetest B: Praktisk regning. Træn og Test. Niveau: 9. klasse. Med brug af lommeregner

c) For, er, hvorefter. Forklar.

5, 10 og 1 4, 5 og 6 7, 11 og 4. 2, 3, 5 og 4 0, 1, 5 og 2 5, 2, 4 og 3. 2, 3, 4 og 1 4, 2 og 3 1, 8, 4 og 3. 5, 3 og 1 3, 4,og 5 3, 4 og 2

2. Ved et roulettespil kan man vinde 0,10,100, 500 og 1000 kr. Sandsynligheden for gevinsterne ses af følgende skema:

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger

J E T T E V E S T E R G A A R D

Deskriptiv statistik for hf-matc

10.1 Et lykkehjul består af 24 lige store felter med numre fra 1 til 24.

Sandsynlighed. for matc i stx og hf Karsten Juul

Deskriptiv statistik for matc i stx og hf

Meningsmålinger - hvad kan vi sige med sikkerhed?

Produkt og marked - matematiske og statistiske metoder

I. Deskriptiv analyse af kroppens proportioner

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger

EMMA*-Tema: Chancetræer

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader

for gymnasiet og hf 2016 Karsten Juul

T ALKUNNEN. Stikprøver. Stikprøver ved brug af computer Stikprøveregler Hverdagens stikprøver. INFA-Matematik: Informatik i matematikundervisningen

SANDSYNLIGHED FACIT SIDE

WORKSHOP 2C, DLF-kursus, Krogerup, 26. november 2015

for gymnasiet og hf 2017 Karsten Juul

Ved et folketingsvalg eller en folkeafstemning spørger man alle stemmeberettigede, og kun en del af dem stemmer.

5.11 Middelværdi og varians Kugler Ydelse for byg [Obligatorisk opgave 2, 2005]... 14

Mandags Chancen. En optimal spilstrategi. Erik Vestergaard

Spor 2. numeralitet. Afdækning af. hos nyankomne elever. Elever på 9 år eller ældre TRIN

Fortsættelse af Regneark II. Indhold. Side 1 af 14. Regneark EXCEL

for matematik pä B-niveau i hf

Løsninger til kapitel 5

Excel-6: HVIS-funktionen

Sandsynlighedsregning og statistik

Prevalens af navnet Lars i det danske folketing

Søren Christiansen

Årsplan matematik 5. klasse. Kapitel 1: Godt i gang

Fortløbende summer NMCC Danmark Muldbjergskolen 8.P

(Projektets første del er rent deskriptiv, mens anden del peger frem mod hypotesetest. Projektet kan gemmes til dette emne, eller tages op igen der)

Talrækker. Aktivitet Emne Klassetrin Side

9 Statistik og sandsynlighed

Sandsynlighedsregning

University of Copenhagen. Notat om statistisk inferens Larsen, Martin Vinæs. Publication date: Document Version Peer-review version

Sandsynligheder. Mængder Hændelser Sandsynligheder Regler for sandsynligheder

Statistik. Introduktion Deskriptiv statistik Sandsynslighedregning

Dig og din puls Lærervejleding

En statistikstuderendes bekendelser Søren Wengel Mogensen

Emmas og Frederiks nye værelser - maling eller tapet?

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

fortsætte høj retning mellem mindre over større

Statistik II 1. Lektion. Analyse af kontingenstabeller

Mini AT-forløb om kommunalvalg: Mandatfordeling og Retfærdighed 1.x og 1.y 2009 ved Ringsted Gymnasium MANDATFORDELING

At lave dit eget spørgeskema

Statistik. Statistik er analyse af indsamlet data. Det vil sige at man bearbejder et datamateriale som i matematik næsten altid er tal.

Løsninger til kapitel 1

RENTES REGNING SIMULATION LANDMÅLING MÅLSCORE I HÅNDBO . K R I S T I A N S E N KUGLE G Y L D E N D A L

Kombinatorik. M-serien består af disse arbejdskort: M1 Formler til kombinatorik M2 Pascals trekant M3 Binomialformlen

Vejledning til forløbet: Hvad er chancen?

Løsning af simple Ligninger

Projekt 1 Spørgeskemaanalyse af Bedst på Nettet

Kombinatorik og Sandsynlighedsregning

MODELSÆT 2; MATEMATIK TIL LÆREREKSAMEN

χ 2 -test i GeoGebra Jens Sveistrup, Gammel Hellerup Gymnasium

Årsplan matematik 6. Klasse

5. Statistik. Hayati Balo,AAMS. 1. Carstensen, Frandsen og Studsgaard, stx mat B2, systime

Supplement til kapitel 7: Approksimationen til normalfordelingen, s. 136

Højere eller lavere kort?

F I N N H. K R I S T I A N S E N TES REGNING MED REGNEARK KUGLE SIMULATIONER G Y L D E N D A L LANDMÅLING

Excel - begynderkursus

Skriftlig eksamen i samfundsfag

Spørgeskemaundersøgelser og databehandling

Løsning til eksaminen d. 14. december 2009

FP9. 1 Esters fritidsjob 2 Katrine maler 3 Backgammon 4 Halvmaratonløb 5 Babyloniernes formel for arealet af en firkant.

Statistik. Deskriptiv statistik, normalfordeling og test. Karsten Juul

Transkript:

RÆSONNEMENT & 1BE V I S F I N N H. K R I S T I A N S E N GNING 2 EGNEARK KUGLE 5 MÅLING SIMULATIONER 3 G Y L D E N D A L MÅLSCORE I HÅNDBOLD

Faglige mål: Håndtere simple modeller til beskrivelse af sammenhænge mellem variable og kunne diskutere rækkevidde af sådanne modeller. Anvende it-værktøjer til løsning af givne matematiske problemer. Forudsatte begreber: Observation, hyppighed, frekvens, kumuleret frekvens, middeltal, sandsynlighed/chance. Inddragelse af supplerende stof: Indsamling og bearbejdning af data, herunder diskussion af hypoteser og af repræsentativitet af stikprøver. SIMULATIONER TIL BESTEMMELSE AF SANDSYNLIGHEDER I kender begreberne observation, hyppighed, frekvens, kumuleret frekvens og middeltal fra deskriptiv statistik. Disse begreber skal i det følgende anvendes i forbindelse med beregning af sandsynligheder. Når man skal bestemme sandsynligheder, er der i princippet to forskellige måder at gå frem. Ved den ene metode argumenterer man logisk og laver udregninger ved hjælp af passende formler. Hvis man fx vil bestemme, hvad sandsynligheden er for at slå de 6 forskellige øjental ved kast med en terning, så kunne man passende argumentere sådan: Da terningen har 6 sider (og i øvrigt er pænt symmetrisk), er der ingen grund til at tro, at nogen af siderne kommer op hyppigere end andre. Derfor er sandsynligheden for hvert af de 6 øjental den samme, nemlig 1 6. Hvis vi imidlertid har mistanke om, at terningen er falsk, så duer denne metode ikke. Vi er nødt til at prøve os frem, så vi beslutter at kaste terningen et stort antal gange. De frekvenser, vi får for de forskellige øjental, kalder vi sandsynlighederne. Sandsynligheder, der er fremkommet på den sidste måde, kalder man sædvanligvis for statistiske sandsynligheder, mens sandsynligheder fremkommet gennem logiske argumenter og beregninger kaldes kombinatoriske sandsynligheder. Hvis man vil beregne sandsynligheden for at vinde de forskellige gevinster i Lotto, så behøver man ikke spille et stort antal gange. Her kan man beregne sig frem til sandsynlighederne. Man bruger altså kombinatoriske sandsynligheder. Hvis man derimod vil beregne sandsynligheden for, at en tegnestift, der kastes på gulvet, lander, så man ikke træder stiften op i foden, hvis man er så uheldig at træde på den, så kan man ikke beregne sig frem Kugle 2

til resultatet. Man er nødt til at udføre forsøget et stort antal gange og herigennem finde ud af, hvor mange procent af gangene dette sker. Så måske vælger man at kaste 1000 tegnestifter ud på et gulv og lave en optælling. Den sandsynlighed, man her når frem til, er statistisk, da den baserer sig på statistik. Man bruger altså statistiske sandsynligheder. Med computeren kan man lave simulationer (at simulere betyder at "lade som om ) som middel til at bestemme sandsynligheder i situationer, hvor man ellers ville regne sig frem med formler. Man kan altså benytte sig af statistiske sandsynligheder i stedet for kombinatoriske sandsynligheder. Det kunne man fx gøre i forbindelse med bestemmelse af sandsynlighederne for at vinde en lottogevinst. Det ville nemlig være forholdsvis enkelt at lave et computerprogram, som simulerer et lottospil. Man bruger betegnelsen computermodel for en sådan efterligning af lottospillet. SIMULATIONER MED COMPUTER Vi skal nu arbejde med et simulationsprogram, KUGLESIM, der simulerer udtagelse af kugler fra en krukke. Kuglerne er røde eller hvide. Den slags udtagelser kan tjene som model for mange forskellige typer af chanceeksperimenter. Programmet KUGLESIM kan håndtere chancesituationer, som kan udtrykkes på følgende måde: 1. Et grundeksperiment resulterer i en enten/eller situation. 2. Grundeksperimentet gentages et antal gange. 3. Til slut optælles, hvor mange gange grundeksperimentet giver en enten situation Et terningkast kan bruges som eksempel. Lad os forestille os, at vi er interesseret i sandsynlighederne for at få 0, 1, 2, 3, 4 eller 5 seksere, når vi kaster en terning fem gange (eller hvad der er det samme: kaster fem terninger på én gang). Dette eksperiment opfylder de tre krav: Ad 1. Vi interesserer os kun for 6 er eller ikke 6 er (enten/eller) Ad 2. Eksperimentet udføres fem gange. Ad 3. Vi optæller til slut det samlede antal 6 ere. Sandsynligheden for at få 0, 1, 2, 3, 4 eller 5 seksere kan udregnes med en passende formel, men i stedet sætter vi computeren til at simulere det. Vi laver en computermodel af spillet. Vi forestiller os, at computeren indeholder en krukke med seks kugler, hvoraf den ene er rød. Hvis vi udtager en tilfældig kugle og får fat på den røde, så svarer det til at slå en 6 er med terningen. Begge har nemlig sandsynligheden 1 6. Kugle 3

Computersimulationen af fem terningkast består i fem gange at udtage en kugle og registrere farven. Kuglen lægges tilbage i krukken efter hver udtagning. Det kalder vi én serie, som vi siger har længden fem i denne situation. Resultatet af serien er antallet af gange, en rød kugler blev udtaget. Tallet registreres i computeren, som på få sekunder kan lave 100 000 serier, og vi kan nu bruge frekvenserne for de seks forskellige resultater som sandsynligheder. Ved simulation af terningkastet ovenfor lagde vi kuglen tilbage i krukken efter hver udtagning. Det skyldes selvfølgelig, at sandsynligheden for at slå en 6 er hele tiden er den samme. Det er imidlertid let at udtænke situationer, hvor man ikke skal lægge kuglen tilbage: Anne skal på ferie og har i sit klædeskab otte T-shirts liggende. Hun har lidt travlt, og griber helt tilfældigt tre af dem og lægger dem i kufferten. Hun har imidlertid glemt, at blandt de otte, er der én, som er for lille og én, som er gået i stykker. Hvad er risikoen for, at hun får begge de ubrugelige T-shirts med på ferie? Her lægger vi otte kugler i krukken, hvoraf to er røde. Vi udtager tre kugler fra krukken. Men denne gang skal vi selvfølgelig ikke lægge kuglen tilbage igen efter hver udtagelse. Anne kan jo ikke udtage den samme T-shirt flere gange. INDFØRING I BRUG AF PROGRAMMET, KUGLESIM Programmet KUGLESIM http://math.ital.dk/ er meget simpelt at bruge. Brugerfladen er vist her under med tallene til Annes ferie. Den indeholder blot indstillingsmuligheder for de variable, som er nævnt ovenfor. I skal: vælge med/uden TILBAGELÆGNING vælge hvor mange kugler krukken indeholder i alt: KUGLER I ALT vælge hvor mange kugler, der er røde: HERAF RØDE vælge SERIENS LÆNGDE. I kan ikke skrive et antal røde kugler, som er større end KUGLER I ALT, og I kan heller ikke udtage flere kugler, end der er i krukken, når I udtager uden tilbagelægning. SERIENS LÆNGDE må ikke være over 2000, og ANTAL SERIER må ikke være over 100 000. Simulationen starter, når I trykker på knappen START SIMULATIONEN. Det tager nogle sekunder, afhængigt af hvor mange serier I vil lave, og hvor mange kugler I udtager fra krukken. I kommentarfeltet har I mulighed for at skrive en tekst, som kommer ud sammen med resultaterne. Der kunne fx stå, hvilken opgave simulationen omhandler og dine initialer. I behøver ikke skrive noget. Kugle 4

Resultaterne bliver præsenteret med det samme på skærmen, men anbringes også i en rapport, som I kan hente frem ved at klikke på det tilhørende ikon, som er vist til venstre. Her er resultaterne af en kørsel af Annes ferie, som de ser ud i rapporten. KOMMENTAR: Annes ferie TILBAGELÆGNING: UDEN KUGLER I ALT: 8 DERAF RØDE: 2 SERIENS LÆNGDE: 3 ANTAL SERIER: 10000 UDSKREVET : 9:27:01 PM Sunday, September 04, 2005 RØDE ANTAL FREKV. KUM.FR. 0 5262 0.5262 0.5262 1 4399 0.4399 0.9661 2 339 0.0339 1.0000 Hver gang I laver et nyt eksperiment, så tilføjes resultaterne til de, som allerede stod i rapporten. Hvis I altså har lavet ti eksperimenter med KUGLESIM, så står der ti sæt resultater i rapporten. I kan frit skifte frem og tilbage imellem KUGLESIM og jeres rapport. Men da KUGLESIM er et web-program, så slet- Kugle 5

tes jeres rapport, når I lukker programmet! Hvis I derfor skal bruge nogle af resultaterne senere til jeres projekt-rapport, så kan I markere det, I skal bruge, og kopiere det over i et tekstdokument på jeres egen computer, før I lukker KUGLESIM. OPGAVER Lav Annes ferie som vist ovenfor og kør simulationen nogle gange efter hinanden Studer derefter resultaterne ved at åbne rapporten. Prøv at sikre dig, at du forstår, hvad tallene i de tre søjler med resultater betyder. Hvad var svaret på spørgsmålet, der blev stillet ovenfor: Hvad er chancen for at Anne får begge de ubrugelige T-shirts med på ferie? Opgave 1 Læg mærke til, at resultaterne varierer lidt fra simulation til simulation. Prøv derefter at sætte ANTAL SERIER til 100 000 i stedet for 10 000. Bliver resultaterne mere stabile fra simulation til simulation? I Danmark regner man med, at ca. 64% har blå øjne (grønne og grå regnes med her). Opgave 2 Hvis der i en klasse er 28 elever, hvad er så chancen for, at der er højst 18 elever med blå øjne? Hvad er chancen for, at der er præcis 18 elever med blå øjne? Christian skal lave omelet med 6 æg. I køleskabet står en bakke med 12 æg. To af æggene er dårlige, men det kan man hverken se eller lugte. Opgave 3 Hvad er chancen for, at Christian undgår de dårlige æg, når han vælger de 6 æg ud? Hvis han i stedet havde haft en bakke med 24 æg, hvoraf 4 æg var dårlige, og igen skulle lave en omelet med 6 æg. Ville chancen for at undgå de dårlige æg så være den samme som før? En bestemt multiple-choice test består af 19 spørgsmål. Til hvert spørgsmål er der tre svarmuligheder. Hvis man har over halvdelen rigtig, består man testen. Opgave 4 Hvad er chancen for at bestå, hvis man intet kender til det emne, der bliver testet i, og derfor vælger svar helt tilfældigt? Kugle 6

På et bestemt HF-kursus går der flest kvinder, nemlig 70%. En dag udtages der tilfældigt blandt samtlige elever 6 personer til at repræsentere skolen ved et møde. Opgave 5 Hvad er chancen for, at der kommer lige mange mænd og kvinder med? I 1600-tallet var sandsynlighedsregningen først så småt i gang med at blive udviklet. Adelsmanden Chevalier de Meré mente at kunne konstatere, at der var lidt større chance for slå mindst én 6 er ved fire kast med en terning, end der var for at slå mindst én dobbelt-6 er ved 24 kast med to terninger. Han bad derfor matematikeren og filosoffen Blaise Pascal (1623-62) om at hjælpe med at afklare spørgsmålet. Pascal beviste, at de Meré havde ret, og han bestemte de to sandsynligheder. Opgave 6 Find de to sandsynligheder (tip: en dobbelt-6 er har chancen 1/36). Bekræfter dine tal, hvad Pascal fandt frem til? Røde Kors sælger lodsedler ved døren. Britt har kun 10 lodsedler tilbage, da hun ringer på min dør. Blandt disse 10 er der faktisk hele tre, som giver gevinst, men det ved hverken Britt eller jeg. Jeg beslutter mig for at købe 5 lodsedler af Britt. Opgave 7 Hvad er chancen for, at jeg ingen gevinst får ud af det? Hvad er chancen for, at jeg får mindst én gevinst? Hvad har resultaterne fra de to foregående spørgsmål med hinanden at gøre? En forhandler af blomsterløg har modtaget et stort parti. Leverandøren meddeler, at man må regne med, at 4% af løgene ikke spirer. Forhandleren vil sælge løgene i pakker 50 løg, og vil nødigt have klager over at færre end 50 løg spirer. Opgave 8 Overvej, hvilken sikkerhed han har for at få tilfredse kunder, hvis han putter lidt flere end 50 løg i pakkerne. Udregn middeltallet for antal røde kugler, når man udtager kugler med tilbagelægning. Brug den metode, du kender fra deskriptiv statistik. Opgave 9 (Prøv fx med en krukke med 20 kugler, hvoraf 8 er røde, og hvor serielængden er 5.) Resultatet skulle blive 5 (8/20) = 2. Kugle 7

Passer det nogenlunde med dit resultat? Tallet 5 (8/20) = 2 angiver vi som formel således: n p = 2, hvor n er serielængden, mens p angiver brøkdelen af røde kugler.) Eksperimentér med andre sammensætninger af krukken og med andre serielængder. Udregn hver gang middeltallet for antallet af røde kugler. Passer det stadig med, at middeltallet bliver cirka n p? Som hjælp kunne du evt. udfylde et skema som dette: N = SERIENS LÆNGDE P = HERAF.RØDE KUGLER.I.ALT N P MIDDELTAL FOR ANTAL RØDE KUGLER. 5 8 20 2 Gælder der en tilsvarende formel, når vi udtager kugler uden tilbagelægning? Prøv selv. Simulér ét møntkast, hvor du registrerer, om du får krone (serielængden er 1). Prøv først at udføre forsøget med ANTAL SERIER = 10. Lad derefter ANTAL SERIER være 20, 50, 100, 1000, 10 000 og til slut 100 000. Opgave 10 Hvad viser frekvenserne for krone efterhånden, som serielængden forøges? Beskriv hvad du ser. Når geologer undersøger hvilke mineraler, der findes i bjergarter i bestemte områder, benytter de undertiden metoder, der kan beskrives ved modeller, som dem vi arbejder med her. I Gros Ventre River i Wyoming, USA blev der i 1967 lavet en undersøgelse for at fastslå forekomsten af mineralet kvarts blandt småsten i floden. Det foregik ved, at man gentagende gange udtog tilfældige stikprøver på ti sten ad gangen. Hver gang blev de ti sten undersøgt for kvarts. Resultaterne kan ses her: Opgave 11 Antal sten med kvarts ud af 10 sten i alt 0 1 2 3 4 5 6 7 8 9 10 Frekvens 0.06 0.25 0.31 0.28 0.09 0.00 0.01 0.00 0.00 0.00 0.00 Kugle 8

Hvilken model passer disse resultater bedst med? Du skal altså prøve dig frem med forskellige værdier af kugler i alt, heraf røde, samt afgøre, om vi her har at gøre med stikprøveudtagelse med eller uden tilbagelægning. Når du har fundet den model som passer bedst, har du et bud P, hvor stor en brøkdel af stenene der er kvartsholdige (nemlig HERAF RØDE divideret med KUGLER I ALT). Man siger, at vi hermed har foretaget en estimation af denne brøkdel (dvs. vurderet størrelsen af den). Det diskuteres med mellemrum flittigt, om der findes mennesker, som har evner, der ikke kan forklares indenfor den etablerede videnskabs rammer. Er det fx muligt for enkelte særligt sensitive mennesker at føle farver med fingerspidserne? Det er der nogen, som hævder de kan. Dette spørgsmål er faktisk blevet undersøgt videnskabeligt ved flere lejligheder. Et af forsøgene forløb således: Der blev anbragt 20 almindelige spillekort på et bord, alle med bagsiden opad. Kortene var ens, bortset fra at bagsiden på de fire var røde, mens bagsiden på resten var blå. Kortene blev blandet grundigt, og forsøgspersonen skulle føle på kortenes bagsider, mens han havde et tæt bind for øjnene. Opgaven gik ud på at finde de fire røde kort. Opgave 12 Prøv at undersøge chancerne for få et godt resultat, selvom man vælger de fire kort fuldstændigt tilfældigt. Hvad synes du i øvrigt, et godt resultat er? Prøv evt. at udføre forsøgte i praksis. Kugle 9

Projekter Projekt C OPINIONSUNDERSØGELSER Ved opinionsundersøgelser udspørger man en gruppe mennesker om fx deres politiske ståsted. Man kunne fx udspørge 2000 mennesker, som man tror, er repræsentative for vælgerne i Danmark. Vi vil her ved hjælp af simulationer med KUGLESIM undersøge, hvilken lid man kan fæste til resultaterne af en sådan undersøgelse. For at gøre det enkelt forestiller vi os her, at man kun undersøger tilslutningen til et enkelt parti. Vi vil altså bruge KUGLESIM til at lave en estimation af vælgertilslutningen til dette parti. Spørgsmålet til deltagerne i undersøgelsen er derfor kun, om man ville stemme på det pågældende parti, eller man ikke ville. Vi forestiller os endvidere, at vi kender tilslutningen til partiet allerede, fx 30%. Det problem, der skal undersøges, er altså: Hvor sikre prognoser får vi for tilslutningen til partiet ved en opinionsundersøgelse? Hvis vi lader krukken indeholde 100 kugler, hvoraf 30 er røde, og udtager en serie på 2000 med tilbagelægning, simulerer vi en opinionsundersøgelse med 2000 deltagere. Når vi har udtaget en enkelt stikprøve, vil antallet af røde kugler i stikprøven være det antal personer, som har sagt, at de er tilhængere af det pågældende parti. Prøv at overveje, hvorfor vi tillader os at lave eksperimentet med tilbagelægning, når vi i praksis aldrig ville spørge den samme person to gange. Prøv at lave eksperimentet i KUGLESIM med ANTAL SERIER = 1. Det ville være rart hvis I fik præcis 30% af 2000 = 600 røde kugler som resultat, for så ville vores opinionsundersøgelse passe præcist med virkeligheden. Men så pænt går det sjældent, som I vil se! Lav eksperimentet med fx ANTAL SERIER = 10 000. Hvor mange procent af eksperimenterne ramte præcist 600 røde kugler? Måske synes vi, det ville være nok at ramme indenfor intervallet 29% - 31%, hvilket svarer til et antal røde kugler imellem 580 og 620. Kugle 10

I hvor mange procent af eksperimenterne skete det? Intervallet ovenfor var 30% ± 1%. Hvis vi vil lave et nyt interval, som skal rumme 90% af de røde kugler, hvor bredt skal dette interval så være? Hermed har vi lavet en række udregninger, som kan sige os noget om, hvor sikre (eller usikre!) prognoser vi får, når man lave opinionsundersøgelser med 2000 deltagere. Forudsætningen var, at partiet (eller synspunktet) havde en tilslutning på 30% i befolkningen. I 90% af tilfældene vil man ramme indenfor det pågældende procentinterval; men i 10% vil man desværre ramme udenfor. Prøv selv at tilrettelægge en videre undersøgelse af problemet. Prøv evt. at undersøge via internettet, hvor mange personer man udspørger ved opinionsundersøgelser. Brug dette antal i de videre beregninger. Hvor sikre prognoser får man, hvis partiet er mindre end det ovenfor (prøv også gerne med et helt lille parti)? Få eventuelt hjælp fra din lærer. VARIANSBEGREBET Hvis I har simuleret udtagelsen af stikprøver ved at udtage de 100 000 serier, som er det højest tilladte, har I fået ret pålidelige resultater. Hvis I imidlertid gentager helt det samme forsøg igen og igen, så vil der dog optræde små afvigelser, når I ser på kolonnen frekvens, selv med udtagelse af 100 000 serier. Projekt D Prøv at udføre det samme eksperiment nogle gange og beskriv disse afvigelser. Prøv nu at vælge en model, altså vælge udseendet af jeres krukke, og om I vil udtage med eller uden tilbagelægning. Eksperimentér med at lave meget få serier fx 100 og lav eksperimentet flere gange efter hinanden. Beskriv forskellene i kolonne antal og i kolonne frekvens Når statistikere skal beskrive den tendens, som tallene i fx kolonnen frekvens har til at variere fra gang til gang, bruger de som regel et begreb, der hedder varians. Vi prøver at forklare begrebet med et eksempel. Kugle 11

Vi vælger et eksperiment med 10 kugler, heraf 3 røde, og vælger en serielængde på 10. Vi vælger med tilbagelægning og vi udfører 100 serier. De 11 tal i kolonnen frekvens kalder vi f 0, f 1,., f 10. Vi vælger én af dem, fx f 4, og vi interesserer os nu kun for f 4. (f 4 er frekvensen for fire røde kugler). Vi antager nu, at f 4 i dette eksperiment er blevet 0,1984. Hvis man gentager eksperimentet nogle gange, så vil man ganske rigtigt se, at frekvensen ud for f 4 varierer, altså ikke er det samme fra gang til gang. Næste gang vi udfører eksperimentet, er frekvensens for f 4 måske blevet til 0,2029, altså ikke det samme som før. Når vi har lavet eksperimentet fx 10 gange, står vi med 10 tal, hvoraf de to første var 0,1984 og 0,2029. Vi finder nu middeltallet (altså gennemsnittet) for dem. Vi antager at middeltallet, m = 0,2005. Variansen udregnes ved at udregne størrelsen ((r 1 m) 2 + (r 2 m) 2 + (r 3 m) 2 +...+ (r 10 m) 2 ), 10 hvor m altså er 0,2005 og de 10 r er er 0,1984, 0,2029, osv. Hvis alle r erne havde været 0,2005, så havde der i hver parentes stået (0,2005-0,2005), altså 0. Når vi opløfter i anden potens giver det stadigt 0, og summen af de 10 tal delt med 10 er derfor også 0. Altså er variansen 0. Denne situation svarer til samme resultat hver gang, altså nul variation. Det er vist klart, at jo større forskel der er imellem r erne og m, jo større bliver slutsummen, altså jo større bliver variansen. Vælg selv tal for KUGLER I ALT og for HERAF RØDE og udfør hver gang 100 serier som i eksemplet ovenfor. Skaf jer på denne måde 10 forskellige tal for én bestemt af frekvenserne (igen som ovenfor). Lav et regneark, som kan udregne middeltallet og variansen, når I indtaster de 10 frekvenser. Eksperimenter med forskellige tal i feltet antal serier, og se, at der sker noget med variansen, når serielængden går op. Hvad sker der? Kugle 12