Statistik. Ib Michelsen
|
|
|
- Ingeborg Kristiansen
- 10 år siden
- Visninger:
Transkript
1 Statistik Ib Michelsen Ikast 2007
2 Forsidebilledet Collage (IM) med hjælp fra Danmarks statistik, Volsted Plantage Jagtkonsortium og Kriminalforsorgen Version 1.0 incl. Sandsynlighed
3 Indholdsfortegnelse Indledning HF-bekendtgørelsen Statistik Deskriptiv statistik Skives ungdom Deskriptorer Et statistisk eksempel Observationer og deskriptorer Boksplot Boksplot Grupperede observationer Histogram Histogrammer og flere deskriptorer Den kumulerede hyppighed Sumkurven Fraktiler Kvartilsæt mv. for grupperede data Middeltal Middeltallet for grupperede data Sandsynlighed Spil på "sekseren" Sikkert eller tilfældigt? Stokastiske eksperimenter Stokastisk eksperiment Stokastisk variabel Frekvenser og sandsynligheder Grundlaget Binomialfordelingen Binomialforsøg Binomialfordelingen Estimat, Hypotese og Test Estimat Hypoteser Test...233
4
5 Indledning I denne sidste del af bogen, skal vi beskæftige os med statistik. Men ikke kun det: det er naturligt at placere statistik i en større helhed, hvori der også indgår sandsynlighed, hypoteser, test og estimat. Men for at få overblik over, hvad der er kernestof og hvad der er supplerende stof citeres bekendtgørelsen i min gengivelse: HF-bekendtgørelsen Kursisterne skal kunne: give en statistisk behandling af et talmateriale og kunne formidle konklusioner i et klart sprog Kernestoffet er: deskriptiv statistik med grafisk præsentation og bestemmelse af simple empiriske statistiske deskriptorer Suppplerende stof omfatter: indsamling og bearbejdning af data, herunder diskussion af hypoteser og af repræsentativitet af stikprøver Statistik Og hvad betyder så ordet statistik? Statistik er videnskaben om at tilvejebringe statistikker, det vil sige: en oversigt over en stats eller staters indre forhold især hvad angår talmæssige forhold. 1 Det første eksempel om Skives ungdom falder i denne kategori selvom Skive ikke er hele Danmark. I dag bruges ordet statistikker også om andre talmæssige forhold end statens som for eksempel i firmaets salgsstatistik. Betydningen af ordet statistik er blevet bredere og dækker nu næsten en hvilken som helst (talmæssig) beskrivelse af et fænomen: vejrstatistik, vildtstatistik... Talmæssige forhold for en stat består tit af overvældende mange tal. Statistikerens arbejde i dette område er derfor ofte at koncentrere sådanne mængder af tal til et eller nogle få tal eller en overskuelig figur, for at læseren ikke skal drukne i information. Sådanne tal kaldes statistiske deskriptorer. Gennemsnitskarakteren er et eksempel på en sådan deskriptor. 1 jævnfør Ordbog over det Danske Sprog, Bind 21, Gyldendal, 1943 (1982) 195
6
7 Deskriptiv statistik
8
9 Skives ungdom Danmarks Statistik 2 er en statsinstitution, der har til opgave at indsamle og formidle oplysninger om alt mellem himmel og jord. I Statistikbanken, der er gratis og offentlig tilgængelig på Internettet, får man et indtryk af bredden ved at se på emneoversigten: Miljø og energi, Befolkning og valg, Uddannelse og kultur, Arbejdsmarked, Løn, Sociale forhold, Sundhed og retsvæsen, Indkomst, Forbrug og priser, Generel erhvervs-statistik, Landbrug, Industri, Byggeri og boligforhold, Serviceerhverv, Transport, Udenrigshandel, Nationalregnskab og betalingsbalancen, Offentlige finanser, Penge og kapitalmarked. Derfra er de følgende data hentet: på tegningen man ser hvordan: Ved hjælp af markeringerne: Skive, 0, 1, 2,... år og 2005 vælger du, hvilke data du vil se. De vises så umiddelbart på hjemmesiden eller de kan hentes ind i et regneark. Herunder ses de data, der er svaret på forespørgslen. Og derunder ses et diagram, der viser (en del af) de samme data
10 Deskriptorer Ved en eksamen har Josephine opnået følgende karakterer: 7, 4, 4, 7, 10, 7, 7, 10, 7, 2, 4, 7, 10, 4, 7, 10, 7, 4, 12, 10. Hvis der er tale om 20 enkeltkarakterer, kan det virke uoverskueligt. Derimod synes beskeden: Josephine bestod X-eksamen med gennemsnittet 7 at være en klar besked og ofte lige så god som alle enkeltkaraktererne. Her vil vi i stedet for ordet gennemsnit bruge ordet middelværdi. Ofte vil man også være interesseret i, hvilke karakterer Josephine har fået flest af: dvs. hendes typiske karakter. "Josephine har typisk fået 7" Når vi har en række observationer, kaldes den observation (her karakter), der er flest af, typetallet. Vi kunne også sortere alle Josephines karakterer i størrelsesorden begyndende med 2, så 4, 4... og til sidst 12. Den karakter, der står midt i rækken er medianen. Er der et lige antal observationer, benytter vi middelværdien af de to midterste observationer. 200
11 Både middelværdi, typetal og median beskriver Josephines eksamen; de er deskriptorer. At de her blev samme tal er ikke sikkert, men at de har omtrent samme værdier er heller ikke unormalt. Hvad der er vigtigt (for os) er, at deskriptoren fortæller det vigtigste uden at vildlede. Det har nok ikke altid været tilfældet... 3 Her var det karakterer vi observerede, men det kunne have været alt muligt andet: mord på ægtefæller, længden af torsk, antal rugende ørne i Danmark, prisen på en tønde olie... Når vi har en række af sådanne (samhørende) data, kan vi give dem en statistisk behandling. Et statistisk eksempel Dette er en undersøgelse af, hvor mange timer en 8. klasse har set tv på et døgn. Observationer: Nr TV 0 0 ½ ½ ½ ½ Nr TV 1½ 1½ 1½ 1½ 1½ 1½ ½ Eleverne er nummererede (øverst), der er altså 21 elever og nederst står det antal timer, de har set tv. Observationssættets størrelse er 21. Her er medianen observation nummer 11 i ovenstående tabel, altså 1½ time. Hvis der kun havde været 20 observationer, ville medianen have været middeltallet af observation 10 og 11. Denne undersøgelse har typetal 1½ time, fordi det forekommer flest gange. Middeltallet er gennemsnittet af antal timer der ses tv, i 3 " There are three kinds of lies: lies, damned lies, and statistics. Benjamin Disraeli British politician ( ) ( 201
12 dette tilfælde: Middeltallet = (0+0+½+½+½ ½+1½+1½+1½+1½+1½+1½ ½):21 = 25,5:21=1,21 Middelværdien af børnenes tv-kiggeri er 1,21 timer/døgn Hyppighedstabel for antal timer Observation Hyppighed Frekvens Frekvens omregnet til % 0 timer 2 2/21=0,095 0,095*100=9,5% ½ time 3 3/21=0,143 0,143*100=14,3% 1 time 5 5/21=0,238 0,238*100=23,8% 1½ time 7 7/21=0,333 0,333*100=33,3% 2 timer 3 3/21=0,143 0,143*100=14,3% 2½ time 1 1/21=0,048 0,048*100=4,8% I alt: 21 21/21=1 100% Du kan finde mere på denne hjemmeside: Beregn karaktergennemsnit for Ida, der fik karaktererne : 4, 7, 7, 10,10 for eleverne til en prøve, der fik karakterer Karakterer Antal karakterer Idas gennemsnitskarakter: Elevgruppens gennemsnitskarakter En sommer er der i højsæsonen solgt følgende antal vaffelis (XTR-Mega) pr. dag: , 320, 398, 265, 225, 175, 195, 285, 267, 165, 138, 185, 168, 241, 350, 375, 300, 280, 264, 277, 239. Beregn middelværdien (gennemsnittet) Find kvartilsættet Dvs: Find først medianen og så medianen for hver af de to dele af materialet over hhv. under medianen.
13 Observationer og deskriptorer En observation er resultatet eller svaret på en undersøgelse ofte et tal. Symbolsk skrives det ofte x i, hvor i står for et eller andet nummer 1, 2, 3... og x i så er værdien af den i'te observation. Et observationssæt er alle de samhørende tal: {x 1 ; x 2 ; x 3 ;... x n } Observationssættets størrelse (n) er antallet af observationer; ofte gives de enkelte observationer numre fra 1 til n som ovenfor. Observationerne kan antage en række mulige værdier; for hver af disse kan vi opgøre, hvor mange af vore observationer, der er lig med denne værdi. Dette er hyppigheden (af denne værdi.) Hyppigheden (h) omregnes ofte til en frekvens (f) således: f = h n Det normale er at angive brøken som decimalbrøk med 2 eller 3 cifre efter kommaet. Frekvensen kan også angives i procent: f = h n 100 % Middeltallet x= x x... x 1 2 n x i = n n Typetallet er den hyppigste observation Medianen er den midterste observation, når observationerne er ordnet efter størrelse. Er der to i midten (når n er lige), benyttes middeltallet af disse to. Nedre kvartil findes som medianen men kun i den første halvdel af observationerne (sorteret i voksende rækkefølge.) Ved ulige antal ses der bort fra midterste observation. Øvre kvartil findes på tilsvarende måde blandt de største observationer. Kvartilsættet er mængden bestående af nedre kvartil (= 1. kvartil), median (= 2. kvartil) og øvre kvartil (=3. kvartil). 203
14 Boksplot Ved hjælp af en simpel tegning (et boksplot eller på dansk: en kassetegning) kan der gives megen information om en række data på en overskuelig måde: I superligaen var målscoren pr. kamp i de første 3 runder, som det fremgår af tabellen: Disse data sorteres efter størrelse (voksende): Det ses, at der er resultater fra 18 kampe. Ifølge definitionen fås medianen så som middeltallet af det 9. og det 10. resultat: Medianen = (3+3)/2 = 3 Der er 9 tal til venstre i (den grønne) tabels første halvdel: Det midterste af disse er 1. kvartil: 1. kvartil = 2 Tilsvarende fås: 3. kvartil = 4 Kvartilsættet bliver så Kvartilsæt = { 2; 3; 4 } Kvartilsættet sammen med mindste og største observation benyttes til at illustrere målscoren i superligakampe i Superligaens første 3 runder i efteråret 2006: runde Mål i superligaen efteråret Antal mål Figuren læses således: Der er markeret en almindelig x-akse (som her er inddelt fra 0 til 6) Observationerne er i eksemplet antal mål pr. kamp Den mindste observation er 1 og den største 5 Kvartilsættet {2;3;4} er benyttet til at tegne den midterste grøn/blå firkant, hvor farveskiftene markerer kvartilerne. Det fremgår fx, at i den mest målfattige fjerdedel af kampene, blev der scoret et eller to mål. 204
15 Boksplot Et boksplot er en figur, der med en boks (= rektangel) viser kvartilerne samtidig med største og mindste observation. Bemærkning: Der er markeret en sædvanlig x-akse, men der er ingen y-akse. Kassens "højde" har ingen betydning. Læsbarheden er nok bedst, hvis tegningen placeres lidt over x-aksen; evt. kan der placeres flere boksplots over hinanden for at kunne sammenligne observationssæt. Sammenligningen kan støttes af lodrette hjælpelinjer for bedre at kunne aflæse tal på x-aksen. Fortsæt eksemplet med vaffelis (3 sider tidligere) og tegn det tilsvarende boksplot. Grupperede observationer I dag vil man nemt kunne håndtere tusindvis af data opsamlet af computere eller i hvert fald indtastet på computer. Tidligere har man møjsommeligt måtte regne med papir og blyant og har derfor ved optælling grupperet sine observationer for at få en vis arbejdslettelse uden at resultaterne for beregningerne ændredes ret meget: I stedet for at Jens var 17 år 287 dage, blev han med en pind registreret fx som én tilhørende aldersgruppen årige. Også i dag må man sommetider nøjes med at arbejde med det offentliggjorte grupperede materiale. Lad os se på et eksempel: Sukkerfabrikken På Wollesen Sukkerfabrik laver man en statistik i forbindelse med påfyldning og pakning i detailemballage: Fra kæmpemæssige lagerbeholdere hældes sukkeret automatisk gennem påfyldningsanlæg ned i tokilogramsposer. Med regelmæssige mellemrum udtages poser, som bliver 205
16 kontrolvejet. Formålet er at kontrollere, at anlægget virker korrekt, så kunderne ikke bliver snydt men også, at firmaet ikke forærer noget væk. Poserne vejer naturligvis ikke præcis lige meget, men er afhængig af anlæggets kvalitet og justering. Idealet er, at variationen er så lille som muligt, således at alle poser vejer mindst 2000 g, men helst ikke meget mere. Man kontrolvejer ikke samtlige poser, men nøjes med nogle få. Man regner med, at man vil opdage fejl, fejljustering og lignende (næsten) lige så hurtigt for en meget mindre omkostning. Teknikken med at udtage nogle få (her poser) af en større mængde, for at sige noget om den større mængde (her: alle posernes vægt) kaldes at udtage en stikprøve fra en population. Når vi angiver størrelsen af en observation, benytter vi ikke uendelig mange decimaler. Sommetider sker der afrunding efter 5-reglen, sommetider afrundes der kun ned. Ved beregningerne skal man være opmærksom på, hvilken afrundingsmetode der er anvendt. Wollesens Sukkerfabrik Stikprøve den kl.11: I modsætning til eksemplet med karakterer, hvor der kun er 7 forskellige, varierer sukkerposernes vægt kontinuert. Det vil sige, at inden for variationsområdet kan en pose veje hvad som helst som fx 2.008, g I princippet er der ikke to poser, der vejer nøjagtig det samme! I tabellen her er resultatet vist i hele gram lad os antage, at der konsekvent er rundet ned. For at få et overblik over alle vægtene i tabellen kan man gruppere materialet: det vil sige, at vi deler variations-området op i en passende mængde halvåbne intervaller (ty 206
17 pisk 5 15 intervaller). Vi laver derfor en tabel, der for ethvert interval angiver intervalhyppigheden, det vil her sige, hvor mange poser har en vægt, der ligger i intervallet. Intervallerne herunder i øvelsen er vist, som man ofte gør, men det bør selvfølgelig præciceres, hvor observationen fx 1990 skal placeres. Da observationen er et nedrundet tal, placeres den naturligt i intervallet og ikke i intervallet Af øvelsen herunder fremgår det, at vi tæller, hvor mange observationer, der falder i et bestemt interval: det er intervalhyppigheden. Ved sammenligning med andre observationssæt af en anden størrelse, kan hyppigheden ikke umiddelbart bruges til sammenligning; omregnes de derimod til intervalfrekvenser, går det fint. Interval "pinde" Intervalhyppigheder l llll Histogram Færdiggør tabellen. Kontroller, at der er 50 observationer! Histogrammet minder om søjlediagrammet, men må ikke forveksles hermed. I søjlediagrammet står der (i princippet) under hver søjle, hvad der måles. Dvs. der er ikke tale om en alm. x-akse! I histogrammet har man et normalt retvinklet koordinatsystem, hvor x-aksen inddeles som sædvanligt!. I eksemplet her vil vi have en x-akse hvor tallene 1980; 1990;..., 2050 er markerede. Den første søjle svarende til intervallet [1980 ; 1990[ tegnes mellem 1980 og 1990, den næste mellem1990 og 2000 osv. Bemærk, at her støder nabosøjler sammen. Højden på 207
18 søjlen svarer til intervalhyppigheden. 4 Histogrammer og flere deskriptorer En intervalhyppighed er antallet af observationer i et bestemt interval En intervalfrekvens er den hertil svarende brøk eller procent. Et histogram er en tegning der viser hyppigheder (eller frekvenser) som søjler; søjlerne er placeret ved siden af hinanden på en sædvanlig x-akse og deres areal svarer til hyppigheden (frekvensen.) Ofte er bredden af søjlerne ens og i det tilfælde svarer søjlernes højde også til hyppighederne (eller frekvenserne.) Et typeinterval er det interval, hvor histogrammets søjle er højest. Bemærk, at hvis intervallerne ikke er lige brede, kan der være et bredere interval med flere observationer end typeintervallet. 4 Hvis alle intervallerne har samme bredde, kan højden på søjlerne afsættes som intervalhypighederne. Men hvis et interval med hyppigheden 15 er 3 gange så bredt som de andre, svarer det jo til 3 søjler med gennemsnitshyppigheden 5. I det tilfælde skal søjlehøjden være 5! Hvis du på y-aksen angiver procent som måleenhed, bør alle søjlerne være lige brede eller hvis du har en søjle med 3-dobbelt bredde, kan du opdele den i 3 søjler med stiplede linjer. Alternativt kan du opgive at benytte y-aksen som målestok for hyppighederne (frekvenserne), men i stedet tegne et lille kvadrat som svarer til fx. hyppigheden: 10 observationer (eller hvis histogrammet er baseret på frekvenser: 10 %) 208
19 Histogram-øvelse Færdigggør histogrammet; det handler stadig om Wollesens Sukkerfabrik. Hvis vi beregner intervalhyppighederne i procent af det samlede antal observationer (n = observationssættets størrelse) findes intervalfrekvenserne. f([1980 ; 1990[) = 1/50 = 0,02 = 0,02*100 % = 2 % f([1990 ; 2000[) = 4/50= 0,08 = 0,08*100 % = 8 % Frekvens-øvelse antal poser gram pr. pose Beregn de resterende intervalfrekvenser ved hjælp af intervalhyppighederne fra den tidligere øvelse. 209
20 Den kumulerede hyppighed Kumulerede intervalhyppigheder Tabellen (nogle sider før) med intervalhyppigheder, kan suppleres med en ekstra kolonne: Summerede 5 intervalhyppigheder: Ud for intervallet: [1980 ; 1990[ skrives 1, fordi: antallet af poser med en vægt, der er ligger i dette interval er 1 (her: intervalhyppigheden.) - og fordi der ikke findes poser med en mindre vægt. Dette var jo det første interval! Ud for intervallet: [1990 ; 2000[ skrives 5, fordi: antallet af poser med en vægt, der er mindre end 2000 er: Dem, der er mindre end 1990 (1) og dem, der ligger i intervallet [1990 ; 2000[ (4); i alt 1+4 = 5. Opstillet en tabel foregår beregningen ret mekanisk: Interval Intervalhyppighed Summeret intervalhyppighed Den summerede (kumulerede) intervalhyppighed er antallet af observationer, der er mindre end det tilsvarende intervals højre endepunkt. For at finde resultatet 13 = benyttes tallet lige over og lige til venstre for 13. De er markeret med gult. Øvelse om summerede intervalhyppigheder Beregn de resterende kumulerede hyppigheder som i skemaet herover. 5 Kumulerede eller summerede 210
21 Interval Intervalfrekvens Kumuleret intervalfrekvens ,02 0, ,08 0, Den summerede (kumulerede) intervalfrekvens er brøken (eller procenten) af observationer, der er mindre end intervallets højre endepunkt. Sumkurven Beregn de kumulerede intervalfrekvenser som påbegyndt i skemaet herover. Sumkurven er defineret som grafen for funktionen, der for enhver mulig observationsstørrelse (x-værdi) angiver brøken (eller procenten) af observationer, der er mindre end denne x-værdi. Overvej, at punkter, hvor x-værdien er højre endepunkt af et interval og y-værdien er den til intervallet svarende summerede intervalfrekvens, ligger på sumkurven! Tegn sumkurven herunder på mm-papir og skitser den på tegningen herunder. F(x) 1 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,
22 Bemærkninger Når vi forbinder støttepunkter for sumkurven, kender vi ikke de enkelte posers vægt; i mangel af bedre viden regner vi med en jævn fordeling og derfor tegnes grafen mellem nabostøttepunkter som rette linjestykker. Fraktiler Definition: p %-fraktilen Vi har en givet sumkurve og tilsvarende funktionen F(x) p %-fraktilen er den (mindste) x-værdi, hvor F(x) = p % Bemærk: p er en y-værdi. Derfor starter du på y-aksen, tegner en vandret linje ud til grafen og fra skæringspunktet tegner du lodret ned til x-aksen, hvor du aflæser p%-fraktilen. Fraktil-øvelse Aflæs på nedenstående figur 10 %-fraktil, 25 %-fraktil, 50 %-fraktil, 75 %-fraktil, 90 %- fraktil, 94 %-fraktil, 100 %-fraktil. Sumkurve procent x På figuren aflæses, at 54%-fraktilen =
23 Kvartilsæt mv. for grupperede data 25 %-fraktil kaldes 1. kvartil (eller: nedre kvartil) 50 %-fraktil kaldes 2. kvartil eller medianen 75 %-fraktil kaldes 3. kvartil (eller: øvre kvartil) Tilsammen kaldes de 3 kvartiler kvartilsættet. Skrivemåden for kvartilsættet er fx Kvartilsættet = {12 ; 17; 21} idet 1. kvartil = 12 osv. Bemærk, at denne definition bruges for grupperede observationer hvor ikke alle enkelte observationer kendes. 6 Lønstatistik 7 Fra Ledernes lønstatistik får man blandt andet oplyst følgende om lønnen for halinspektører i 2005: Ledernes lønstatistik 2005 Halinspektører Nedre Kvartil (1.) Median Øvre Kvartil (3.) % -fraktil Indtegn en delvist skitseret sumkurve for halinspektørernes løn på mm-papir. Hvilken månedsløn får en halinspektør, der ligger på 61 %-fraktilen? Hvilken fraktil svarer månedslønnen kr. til? 6 Det er bestemt ikke normalt, at det samme begreb defineres på to forskellige måder, der vel at mærke giver forskellige resultater. I Danmark er der en gammel tradition for at anvende definition, der bygger på fraktiler. Denne tradition er ved at blive erstattet af den mere intuitive definition, du tidligere har set. For ikke at blive misforstået, når du anvender kvartilsæt, må du derfor tilføje, hvordan kvartilsættet er fundet: Enten ved hjælp af de tre fraktiler eller ved hjælp af de tre observationer, der deler materialet i 4 lige store dele
24 Lægevagten Hos lægevagten i X-købing har man lavet statistik over antallet af henvendelser, som det fremgår af skemaet under øvelsen. Tegn et histogram, der svarer til tabellens oplysninger Beregn det gennemsnitlige antal henvendelser pr. døgn Hvad er typeintervallet? Beregn frekvenserne, der svarer til hyppighederne Beregn de summerede frekvenser Tegn sumkurven Find kvartilsættet Hvor mange procent af døgnene var der færre end 125 henvendelser? Hvor mange procent af døgnene var der flere end 200 henvendelser? Tegn et boksplot Antal henvendelser pr. døgn Hyppighed Middeltal Middeltallet x For en række observationer x, 1 x2,..., x kan middeltallet beregnes som: x1 + x xn x = n n I forbindelse med Josephines karakterer blev gennem 214
25 snitskarakter omtalt som middeltal. På nøjagtig samme måde kan vi beregne middeltallet for sukkerposerne på Wollesens Sukkerfabrik hvis vi kender de individuelle vægte. x = /50 = 2.018,8 det vil sige, at poserne i gennemsnit vejer 2.018,8 gram Forudsætter vi, at poserne i gennemsnit er rundet ned med 0,5 g, skal dette lægges til så gennemsnittet bliver 2019,3 g. Ofte har man imidlertid kun de grupperede data til rådighed til beregning af middeltallet, hvilket i princippet er umuligt i henhold til ovenstående definition. Løsningen er: at lade som vi kender dem: Interval hyppigheder h midtpunkt m m*h [1980 ; 1990[ [1990 ; 2000[ [2000 ; 2010[ [ [ [2030 ; 2030[ [2030 ; 2040[ [2040 ; 2050[ Ialt Middeltal = / Forudsætningen for rigtigheden er, at gennemsnittet for observationerne i hvert interval = intervalmidtpunktet. Det er naturligvis kun omtrent rigtigt, men så kan vi yderligere antage, at fejlene omtrent udligner hinanden. Sammenlignes resultaterne 2019,3 og 2019 ser det ud, som denne antagelse er rimelíg i hvert fald for det anførte eksempel. Middeltallet for grupperede data For en række observationer x, 1 x2,..., xn kan middeltallet beregnes som: hi mi x = n hvor det græske bogstav (store sigma) betyder, at man skal addere: her er det en række produkter; hvert produkt har faktoren h (intervalhyppigheden) og faktoren m (intervalmidtpunktet.) 215
26 Det er præcis denne definition, vi har anvendt ved beregningen i ovenstående tabel. Rind Dambrug På Rind Dambrug kontrolleres ørredproduktionen: Man har taget en stikprøve på 40 ørreder og vejet dem for at vurdere, om produktionen er salgsklar. Resultatet fremgår af tabellen: Rind Dambrug Kontrolvejning 15. marts Hvad er typeintervallet? Beregn middelværdien For dambruget er det selvfølgelig uden betydning, om de 40 ørreder er salgsklare men som stikprøve skal de fortælle noget om alle ørrederne, man planlægger at sælge. 216
27 Sandsynlighed Spil på "sekseren" Under 2. verdenskrig 8 blev der gravet brunkul i Midtjylland og der (og mange andre steder) var der smugkroer, hvor man spillede Fortuna eller på "sekseren": et populært (og ulovligt) hasardspil. 9 Spillet var uhøre enkelt: Der benyttes en spilleplade som nedenstående og 3 terninger: Først bestemmer hver spiller sin indsats: stor eller lille efter eget ønske. Der kan sættes penge på et eller flere tal. Der kan være en eller mange spillere, der spiller mod Banken. Pengene lægges på pladen på det tal, man satser på. Antag, at du har satset 500 kroner på 2'eren. Bankøren ryster raflebægeret med de tre terninger og vender det. Regnskabet 1. Er der nul toere, er indsatsen tabt 2. Er der en toer, vinder du din indsats: altså 500 kr. fra banken (og beholder indsatsen). Tilsvarende: 3. Er der to toere, vinder du to gange 500 kr. og Den, som søger erhverv ved hasardspil eller væddemål af tilsvarende art, der ikke ifølge særlig bestemmelse er tilladt, eller ved at fremme sådant spil, straffes med bøde eller fængsel indtil 1 år. Stk. 2. Retten afgør, om det vundne udbytte skal inddrages eller tilbagebetales. (Straffelovens 203) 217
28 4. Er der tre toere, vinder du tre gange 500 kr. Øvelse: Spil på "sekseren" Gevinst "Pinde" Hyppighed Frekvens Antal observationer i alt Samlet gevinst (+) eller tab(-) i "sekser-kroner": I grupper på ca. 4 elever trækkes der lod: en er bankør og resten er spillere Alle - både bankør og spillere - udstyres med "matadorpenge" af læreren; spillerne får også et regnskabsark som ovenstående Der spilles nogle runder i minutter eller indtil banken er gået konkurs eller spillerne har mistet alle deres penge. Efter hver runde (eller spil) sætter hver spiller en "pind" for at lave statistik over sit spilleforløb Efter spillet diskuterer gruppen: Hvem vil du helst være: bankør eller spiller? Hvorfor? Er det et fair spil? Kan banken gå fallit? Hvordan skal gevinsterne ændres, før du skifter mening? Hvornår er det ligemeget, om man er bankør eller spiller? Er der nogen udfald af terningekastet der er gode for banken? Findes der en god "strategi for spillerne? Sammenlign spillernes frekvenser. Ligner de hinanden? hvorfor? 218 Kan man regne ud, hvad frekvenserne omtrent bliver?
29 In plenum: Diskussionen samles op. Grupperne argumenterer for deres svar. Evt. udarbejdes et samlet frekvensskema for alle spillere. Find matadorpenge 10 Øvelse: Præsidentvalget Gore vs. Bush jr. De to kandidater fik ved præsidentvalget i 2000 omtrent lige mange stemmer; Gore flest i US som helhed ("the popular majority"), men valget af præsident og vicepræsident afgøres af "United States Electoral College", som består af et antal repræsentanter fra de respektive stater. Helt afgørende blev staten Florida, hvor optællingen viste næsten samme antal stemmer til hhv. demokrater og republikanere. Officielt endte optællingen med et flertal til Bush jr. på 537 i denne stat ud af afgivne stemmer. Hvis Gallup eller et andet opinionsundersøgelsesinstitut skulle spå om valgresultatet, kunne det så spå rigtigt? helt sikkert? Hvis der var 6 konkurrerende institutter, der uafhængigt af hinanden spåede om resultatet, kunne de så alle spå rigtigt? Eller alle spå forkert? Hvilke kombinationer af forudsigelser ville du forvente, når du nu kender afstemningsresultatet? Se 11 Sikkert eller tilfældigt? Når man lader en terning falde fra Rundetårn kan man måle (eller se): 10 Find pengene: "Sekserpenge" 11U.S. presidential election, 2000, Florida electoral votes (Margin: % svarende til 537 votes af 5,962,657 votes in Florida). Kilde: en.wikipedia.org 219
30 hvor lang tid der går fra terningen slippes til den rammer fortovet eller hvor mange øjne terningen viser. I det første tilfælde udføres et deterministisk eksperiment: vi har funktioner, der beskriver faldhøjden som en funktion af tiden. Forsøgets resultat kan beregnes før det gennemføres. Det kan gentages og resultatet bliver det samme. I det andet tilfælde udføres et stokastisk eksperiment: resultatet afhænger af tilfældigheder og kan ikke forudsiges sikkert. Dog ved vi, at terningen må vise 1, 2, 3, 4, 5 eller 6 øjne. Beskrivelsen her er sort-hvid; matematiske modeller er forenklede beskrivelser af virkeligheden. I modellen kan vi lave en serie fuldstændig ens eksperimenter, fordi vi bevidst ser bort fra det uvæsentlige i den virkelige verden. Det deterministiske eksperiment er derfor en idealforestilling fra modellernes verden. Stokastiske eksperimenter Forudsætningen er: under så vidt mulige velbeskrevne og kontrollerede omstændigheder udføres et eksperiment en eller flere gange. Eksperimenter har et udfald. For de deterministiske er der kun et muligt udfald modsat stokastiske, hvor der er flere mulige udfald. Terningekastet har 6 mulige udfald: nemlig 1, 2, øjne. Vi regner kun med disse 6 mulige udfald og ser bort fra, at terningen kunne gå i stykker, forsvinde eller blive stående på et hjørne. Stokastisk eksperiment Et eksperiment udføres på nøjagtig samme måde, men resultatet varierer uforudsigeligt hver gang. De mulige udfald kan beskrives som et udfaldsrum (= mængden af mulige udfald.) Den eneste viden, der haves er, at vi i det lange løb vil se et mønster i frekvenserne for observationer af forskellige udfald. 220
31 Stokastisk variabel Det vi måler ved et stokastisk eksperiment, kaldes en stokastisk variabel. Et eksempel kunne være gevinsten ved et enkelt spil i et kasino på en roulette. Eller gevinsten (- snarere tabet) ved 100 spil. Eller hvor mange gange ud af 100 kuglen lander på "ulige". Bemærk, at det udfald vi observerer kan være farven (rød eller sort), men i samme eksperiment kan man også observere for eksempel nummeret (1-36) eller lige/ulige. Øvelse: Stokastisk variabel Hvis det "stokastiske eksperiment" er et spil på "sekseren": Find to forslag til en stokastisk variabel! Eksempel Fra en serie på 1000 terningeslag er der i tabellen herunder vist frekvensen af 6 ere for det første eksperiment, for de 2 første,... og for de 10 første: Slag Frekvens ,00 0,50 0,33 0,25 0,20 0,33 0,29 0, ,33 0,40 Diagrammet herunder viser grafisk hvorledes (i dette tilfælde) frekvensen nærmer sig et tal i nærheden af 1/6; faktisk er den sidst målte frekvens 0,172 (og 1/6 = 0,167). Frekvens af 6'ere 1 0,8 0,6 0,4 0, Terningeslag 221
32 De 6 mulige udfald for terningekastet er en mængde, der kaldes udfaldsrummet. I udfaldsrummet kan vi udvælge vilkårlige delmængder som slag med 5 og 6 øjne. I eksemplet her er Udfaldsrummet = U = {1; 2; 3; 4; 5; 6} Delmængden = D = {5; 6} Udfaldsrum Delmængde Udfald Frekvenser og sandsynligheder Når en række eksperimenter har fundet sted, kan vi med hyppigheder og frekvenser beskrive eksperimenterne. Dertil benyttes teknikken fra den deskriptive statistik. Når vi ser, hvorledes frekvenser (for et bestemt udfald) ser ud til at nærme sig et bestemt tal mellem 0 og 1, når serien af eksperimenter bliver længere og længere, kunne man forestille sig, at der fandtes et sådant bestemt tal, som vi kunne kalde P 12. På den baggrund er der opbygget en teori til beskrivelse af stokastiske eksperimenter, der tager udgangspunkt i: at der findes en funktion, der til enhver begivenhed (svarende til delmængder eller enkelte udfald) kan angives en funktionsværdi mellem 0 og 1 (dvs. sandsynligheden for begivenheden.) Teorien hviler på nogle grundsætninger (jævnfør og sammenlign med Euklids Elementer) som ikke (kan) bevises, men som er inspireret af frekvenser. Herfra udledes så teorien om sandsynligheder. Men hvor Euklids aksiomer har langt over 2000 år på bagen er de tilsvarende for sandsynlighedsteorien under 200 år. 12 P anvendes som generel forkortelse for sandsynlighed (fra engelsk Probability.) 222
33 Selvom teorien er matematisk sand er den jo kun et idealiseret billede af den virkelige verden, og den er kun interessant for andre end matematikere, hvis den leverer et brugbart billede af den virkelige verden. Historisk set er det som skrevet overvejelser om udfald af spil, der starter sandsynlighedsregningen. Tidligt gives udfaldet 6 øjne i et terningeslag sandsynligheden 1/6. Ikke fordi man havde eksperimenteret med (næsten) uendelig lange serier af terningekast, men fordi det synes logisk. Af symmetrigrunde. Det kaldes en a priori viden. På et senere tidspunkt interesserer statistikere sig for demografi (befolkningslære.) I den sammenhæng kan en fødsel betragtes som et stokastisk eksperiment med to mulige udfald: dreng eller pige. Hvis man brugte et symmetriprincip kunne sandsynligheden for at få en dreng være 0,50 eller 50%. Men erfaringen viser, at der fødes flere drenge end piger, og at frekvensen af drenge i forhold til samtlige fødte er uhyre konstant. Sandsynligheden for at få en dreng kan så opfattes som den ukendte brøk, den målte frekvens er tæt på og påstås det nærmer sig. I modsætning til a priori kaldes dette a posteriori viden. Grundlaget Lad os præcisere og opsummere grundlaget: Vi beskæftiger os med stokastiske eksperimenter og benytter her terningekastet som eksempel. I forbindelse med eksperimentet defineres en stokastisk variabel: X. Ved et kast tælles terningens øjne. Udfaldet der vises 2 øjne, skrives ofte X=2. Vi definerer en funktion P. Definitionsmængden for P er enhver delmængde D af udfalds-rummet U. Til sammenligning med tidligere funktioner: Her bruges altså bogstavet P i stedet f eller g eller... D erstatter x; istedet for bogstavet D kan der være en beskrivelse af delmængden med almindelige ord Bemærk, at forskellige delmængder godt kan have en eller flere udfald fælles. 223
34 f(x) erstattes så af P(D) 14 Udfald Udfaldsrum Delmængde Der er tegnet en delmængde (den røde ring) som et eksempel og for hver ring, der overhovedet kan tegnes, har vi en delmængde, der må have en sandsynlighed. For P gælder: P(U) = 1 Reglen siger, at det er sikkert, at vi får et af de mulige udfald. Anvendt på eksemplet er U = {1; 2; 3; 4; 5; 6} Påstanden læses: Sandsynligheden for at få et af udfaldene i U (altså fra 1 til 6 øjne) er 1 eller 100%. 0 P(D) 1 Påstanden læses: Sandsynligheden for et udfald i delmængden D (som kan være udfald med 5 øjne eller udfald med et lige antal øjne eller udfald med højst 2 øjne..) ligger mellem 0 og 1. P( ) = 0 er den tomme mængde; den indeholder ikke nogen udfald fra udfaldsrummet. X kan derfor ikke få en værdi fra. Hvis D 1 D 2 =, gælder: P(D 1 D 2 )=P(D 1 )+ P(D 2 ) Forudsætningen er: De to delmængder har ingen fælles udfald. I eksemplet kunne de to delmængder være hhv. D 1 ={1; 3} og D 2 ={4; 5}. Så er D 1 D 2 = {1; 3; 4; 5} 14 D kan altså skrives som X>2 eller ulige antal øjne
35 Øvelse: Find delmængder Tænk på kast med en terning. Skriv udfaldsrummet op. En delmængde kan være: {1, 5, 6}. Skriv så mange delmængder op, som du kan, i løbet af 2 minutter. Beskriv nogle af dem med ord og nogle med X og tegn som <, >, =. Øvelse: Empirisk begrundede sandsynligheder (a posteriori) Claus Binger skyder med bue og pil mod en skive med et centrum og 3 ringe udenom: Ifølge hans egen statistik regner han med følgende sandsynligheder: Binomialfordelingen Claus rammer Claus skyder forbi Udfald Centrum 1. Ring 2. Ring 3. Ring Forbier P 0,30 0,40 0,25 0,05 0,00 Hvad er P(Claus rammer 1. ring) =? Hvad betyder det? 1 år senere ville Claus have ændret skemaet til: Claus rammer Claus skyder forbi Udfald Centrum 1. Ring 2. Ring 3. Ring Forbier P 0,35 0,45 0,02 0,00 Hvad er så nu P(Claus rammer 2. ring) =? Er han blevet bedre eller dårligere? Kan det måles? Lad os tænke på et eksperiment, hvor der kun er to mulige udfald: succes og fiasko. Det kan være: 1. spillet: plat eller krone 2. terningekast, hvor et bestemt antal øjne udnævnes til succes 3. fødsel, hvor fødsel af et udvalgt køn (ikke nødvendigvis det samme i alle subkulturer) kaldes succes. 225
36 Binomialforsøg Et eksperiment med 2 mulige udfald kaldes et binomialforsøg. Kaldes sandsynligheden for det første udfald (=succes) p, giver det sig selv, at sandsynligheden for det andet udfald (=fiasko) er 1-p. Udfald Succes Fiasko P p 1-p Forestil dig, at du gentager et sådant forsøg 10 gange eller n gange. De 10 eller n eksperimenter udgør også et samlet eksperiment, hvor man kan tælle antallet af successer. Dette tal er en stokastisk variabel X, som siges at følge binomialfordelingen 15 : Binomialfordelingen X følger en binomialfordeling, hvis X er en stokastisk variabel, der tæller antal succeser i n binomialforsøg. Det skrives: X ~ b(n;p) hvor U = {0; 1; 2; 3;... ; n-1; n} og b minder om, at det er en binomialfordeling; n er antallet af binomialforsøg og p er sandsynligheden for succes i det enkelte binomialforsøg. Hvis X ~ b(10;0,5) tæller X antal succeser når vi laver et binomialforsøg 10 gange; i hvert af forsøgene er sandsynligheden for succes 0,5 = 50%. P(X=3) betyder: sandsynligheden for at få 3 succeser blandt de 10 binomialforsøg. 15 "Bi" betyder noget med to; kendes fra: Urbino (italiensk bynavn: to byer), bismag, birolle og biseksuel. 226
37 Øvelse Binomialfordeling I Lad X~b(10 ; 0,5). Hvor uheldige kan vi være? hvad er det mindste antal succeser, vi kan få? Hvad er det største antal? Hvad er udfaldsrummet U =? Hvis du skulle gætte på et antal succeser før du lavede de 10 forsøg: hvad ville du så gætte på? Prøv at slå plat og krone 10 gange; tæl kroner (=succes.) Fik du hvad du gættede på? Hvis ja: sker det også næste gang? Hvis nej: hvad vil du nu gætte på, hvis du gentager forsøget? Ved hjælp af lommeregner, tabeller eller regneark er det muligt at finde punktsandsynlighederne (dvs. sandsynligheden for det enkelte udfald) eller for en delmængde af udfaldsrummet. Sandsynlighederne kan beregnes med regnearket: Binomialfordeling. (Se øvelserne herunder) Øvelse Binomialfordeling II Forklar med egne ord, hvad der kan læses i skemaerne herunder. Beregn følgende sandsynligheder, idet vi forudsætter X~b(12; 0,3) P(X=0) P(X<4) P(X 10) P(3,5 X 10 ) P(X>0) P(X er ikke 11) P(X=a) n= 10 p= 0,2 a= 4 P(X=a) 0,0881 P(X<=a) n= 10 p= 0,2 a= 4 P(X<=a) 0,9672 P(a<=X<=b) n= 10 p= 0,2 a= 3 b= 6 227
38 Øvelse Tordenskjold Tordenskjold havde 11 brødre og 6 søstre. Hvis hver fødsel er et eksperiment med sandsynligheden 0,51 for at få en dreng: Hvad er så hr. og fru Wessels sandsynlighed for at få netop denne kombination af piger og drenge (givet antal fødsler)? Hvad er sandsynligheden for at få mindst 12 sønner ved 18 enkeltbarnsfødsler? Øvelse Gallup Ved en Gallupundersøgelse udspørges 1200 vælgere, om de vil stemme på partiet W. 70 vælgere svarer, at de vil stemme på partiet. Partiet hævder, at det vil få 7% af stemmerne ved næste valg. Hvad mener du? Øvelse Cola Når man vil teste, om en gruppe mennesker kan smage forskel på 2 produkter (som for eksempel forskellige varianter af cola), kan man lave følgende binomialforsøg: Hæld cola op i 3 glas således at indholdet i de 2 glas er det samme, men det tredie glas indeholder den anden cola. Forsøgspersonen ved ikke, hviket glas der har et andet indhold end de to andre. Forsøgspersonen bliver nu bedt om at udpege det glas, der smager anderledes. Hvorfor er dette et binomialforsøg? Hvis forsøgspersonen kan pege på det rigtige glas, er udfaldet en succes. Hvad er p i binomialforsøget, hvis forsøgspersonen bare gætter? Hvad er p i binomialforsøget, hvis forsøgspersonen sikkert kan smage forskel? Da binomialforsøget blev gentaget 12 gange fik vi 5 rigtige svar. Kan forsøgspersonen (eller forsøgspersonerne) sikkert smage forskel på de 2 colaer? (Meget let spørgsmål!) Kan det tænkes, at de alle bare har gættet? 228
39 Øvelse: Sprogbrug Estimat, Hypotese og Test Estimat Hvorfor er det rimeligt at sige, at sandsynligheden er 2/3 for at få mindst 3 i et terningekast med en sædvanlig terning? Hvad er så sandsynligheden for at få mindst 3 mindst 6 gange af 10 kast? Hvis det lyder knudret skal du prøve at slå 10 slag; for hver slag noterer du, om du fik mindst 3? Så var det slag en succes! Hvor mange succeser fik du ialt? Var det mindst 6 gange? Prøv så at besvar spørgsmålet igen. Eksempel: Opinionsundersøgelser og estimater Når Gallup, Observa, Sonar eller andre spørger 1400 udvalgte personer (stikprøven), hvilket parti de vil stemme på ved næste folketingsvalg (og hvilken sæbe, de vasker sig med - og hvilken filmstjerne de drømmer om og mange andre interessante forhold), er det ikke fordi man er interesseret i netop disse menneskers meninger og vaner. Man spørger, fordi man tror, at man ved hjælp af svarene kan få noget at vide om hele befolkningens (populationens) holdning til fx de politiske partier. Interessant for partierne er det at få oplyst, hvilken procentdel af befolkningen, der pt. vil stemme på dem. Det kan man ikke få at vide uden at spørge alle - og det er for dyrt. Men ved hjælp af stikprøven, kan vi gætte - og forhåbentligt fornuftigt. I vores eksempel vil vi gerne kende procenten (eller brøken) p, som fortæller om den brøkdel af stemmerne et parti vil opnå. p er altså et ganske bestemt tal - i denne sammenhæng. Ved hjælp af stikprøven kan vi regne mange forskellige tal ud; for eksempel den brøk i stikprøven, der har villet stemme på det pågældende parti. Vi gætter på, at dette tal 229
40 er tæt på det rigtige. Sådanne gæt kaldes estimater, og i princippet kan de vise det fuldstændigt rigtige svar, et omtrent rigtigt svar og noget fuldstændigt forkert. Men estimatet er hverken det samme hver gang og der er ingen garanti for, at det er "tæt" ved tallet vi søger. Estimatet er et resultat af et stokastisk eksperiment, hvor vi konstruerer en (særlig) stokastisk variabel (kaldet estimatoren): den tilfældige værdi af denne er estimatet. Lad os antage, at vi ved, at partiet NN har en vælgertilslutning på 30 %, og at vi laver en miniopinionsundersøgelse ved at spørge 10 tilfældigt udvalgte personer. Hvis stikprøven skal ligne populationen, skal der være 3 i stikprøven, der vil stemme på partiet. Men tilfældet er en skælm: Der kan jo være alt fra 0 til 10, der siger ja. Og selv om vi ved, at X~b(10; 0,3) kan vi komme til at gætte på, at parameteren p = 0,0; 0,1; 0,2;... ; 0,9; 1,0. I den følgende øvelse vil vi vurdere, hvor gode gæt er under forskellige omstændigheder. En vigtig pointe ved disse undersøgelser er, at alle i befolkningen skal have nøjagtig den samme chance for at være med. Ellers bliver undersøgelsen misvisende. Og det er sket utallige gange. Hvordan man sikrer sig dette - så godt som muligt - er en større videnskab, og behandles ikke her. 230
41 Øvelse: Vurder værdi af estimat r Idet du benytter regnearket: besvares spørgsmålene herunder. Udskriv histogrammerne. Vi spørger 200 personer og "ved", at der i befolkningen er 30 % (dvs. p=0,3) Indtast værdierne i regnearket der svarer hertil, så du får tegnet et histogram (med de teoretiske frekvenser.) Hvad er de typiske udfald af eksperimentet? Hvilke værdier af p svarer det til? Hvad er P(46<X<50))? Hvad er P(43<X<50))? Hvor tit vil det ske, at selvom om p=0,30, vil man gætte på, at værdien er 0,25 eller mindre? Besvar det sidste spørgsmål igen ved forskellige stikprøvestørrelser: n=100, 400, Sæt alle svarene ind i en tabel med to rækker. Øverst er x-værdier: stikprøvestørrelsen, og nederst y-værdier: de tilsvarende brøker fundet i pkt. e og f. Indtegn resultatet fra g i et koordinatsystem på. Hvad observerer du? Kan du forklare, hvorfor alle undersøgelser af denne type benytter stikprøver i størrelsen fra 700 til 1500? Teoretisk set er der ingen søjler i histogrammerne, der har højden 0%, men i praxis ser det sådan ud. Prøv at lave en tabel, hvor n = 100, 200, står i x-rækken og tallet i y-rækken beregnes sådan: I hvert histogram findes den største x- værdi, hvor det kan ses, at søjlen ikke er nul. Tilsvarende findes den mindste x-værdi, hvor det kan ses, at søjlen ikke er nul. De to tal trækkes fra hinanden; forskellen er y- værdien. Kan vi beskrive sammenhængen mellem x og y med en pæn funktion? 231
42 Hypoteser Når nogen fremsætter en påstand, kaldes det her en hypotese. Hypoteser kan være sande eller falske og vi kan tro på dem eller lade være med at tro på dem. Øvelse: Muligheder for en hypotese Hypoteser Udfyld skemaet, så ovenstående muligheder står klart. Hvilke af mulighederne er "gode" og hvilke er "uheldige"? Eksempler på hypoteser kan være: % af de stemmeberettigede vil pt. stemme på partiet X % af sukkerposerne vejer over 2000 g 3. Der er gevinst på hver 10. lodseddel I forbindelse med hver af hypoteserne vil der så være en alternativ hypotese: at hypotesen ikke er rigtig. I det første eksempel er den alternative hypotese: Nej der er ikke 13 %, men færre (flere.) Om man vil bruge færre eller flere afhænger selvfølgelig af, hvem der fremsætter påstanden; er det partiets presseafdeling eller spindoktor, vil man formode, at han vil tegne et optimistisk billede af situationen og evt. overdrive tilslutningen. Så benyttes færre. 232
43 Test Når man undersøger en hypotese, kaldes det at teste hypotesen. En test går ud på at gennemføre et eksperiment, regne med at den oprindelige hypotese er sand og derefter vurdere, om udfaldet af eksperimentet er sandsynligt i den givne model. Hvis resultatet er usandsynligt; dvs. kun sker for eksempel 1 ud af 100 gange, vil vi forkaste hypotesen, dvs. vi tror ikke påstanden er sand. Men vi ved godt, at en gang i mellem sker det usandsynlige (som for eksempel at vinde den store milliongevinst.) Men det regner vi ikke med til daglig. Så en gang i mellem begår vi fejl. Hvis resultatet ikke er usandsynligt (og det er noget andet end sandsynligt!!) forkaster vi ikke hypotesen. Den kan være rigtig eller nogenlunde rigtig. Vi ved i hvert tilfælde ikke nok til at afvise den. Og også her kan vi begå en fejl ved ikke at forkaste en forkert hypotese; hypotesen er bare ikke nok forkert til at vi med sikkerhed kan afvise den. Eksempel på hypotese og test Lad partiet W hævde, at deres tilslutning blandt vælgerne er 7 %. Vi lader nu Observa spørge 1000 tilfældigt udvalgte vælgere, om de vil stemme på W. Vi går ud fra en masse urealistiske forhold vedrørende modellen: At de udspurgte er tilfældigt udvalgte blandt alle stemmeberettigede At alle vil svare og svarer At de svarer ja eller nej At de svarer ærligt At vi kan bruge en binomialfordeling som beskrivende model At modellen i dette tilfælde er: X~b(1000 ; 0,07) 233
44 Hypotesen (kaldet Ho) er: p = 0,07 Den alternative hypotese er: p < 0,07 Vi får nu svaret fra Observa: 1. Antag svaret er: 41; hvis påstanden om p = 0,07 er rigtig, kan vi med binomialfordelingen beregne, at dette resultat (eller noget der er endnu ringere) kun indtræffer i 0,01 % af alle tilfælde. 2. Derfor forkastes hypotesen; vi tror ikke at Observas undersøgelse har ramt et så forkert resultat vel vidende, at det sker en gang i mellem. 3. Hvis svaret i stedet for havde været 55, kunne man tilsvarende beregne, at det sker i 3,3 % af alle tilfælde; hvis W har været meget uheldig, kan deres påstand godt være rigtig og vi forkaster ikke hypotesen. Det kan godt være, der er en smule tvivl om det nu kan passe, men tvivlen er ikke stærkt nok begrundet til at vi vil sige: det her med 7 % tror vi ikke på. 234
45 Stikordsregister a posteriori a priori Binomialfordelingen...225f. Binomialforsøg boksplot Boksplot deskriptorer Deskriptorer deterministisk Estimat estimater estimatoren fejl forkaste hypotesen Fraktiler frekvens gennemsnit Grupperede observationer histogram Histogram hypotese Hypotese Hypoteser hyppighed Hyppighedstabel intervalfrekvens...207f., 211 intervalhyppighed...207f. kontinuert kumulerede...210f. kumulerede hyppighed kvartilsæt Kvartilsæt mv. for grupperede data Kvartilsættet median Median Middeltal Middeltallet Middeltallet for grupperede data middelværdi Nedre kvartil
46 236 observation observationssæt Observationssæt Observationssættets størrelse...201, 203 population populationens Sandsynlighed sekseren Sigma Statistikbanken stikprøve stikprøven stokastisk Stokastisk eksperiment Stokastisk variabel Sumkurven summerede...210f. Summerede 5intervalhyppigheder Summerede intervalhyppigheder søjlediagram Test...229, 233 teste hypotesen typeinterval typetal Typetal udfaldsrum udfaldsrummet variationsområdet X~b(10; 0,3) Øvre kvartil...203
47
48
Deskriptiv statistik
Deskriptiv statistik Billedet Collage (IM) med hjælp fra Danmarks Statistik, Volsted Plantage Jagtkonsortium og Kriminalforsorgen Version 1.7 incl. Sandsynlighed 16-3-2009 Editeret 18-1-2012 og 6-2-2012
Statistik. Peter Sørensen: Statistik og sandsynlighed Side 1
Statistik Formålet... 1 Mindsteværdi... 1 Størsteværdi... 1 Ikke grupperede observationer... 2 Median og kvartiler defineres ved ikke grupperede observationer således:... 2 Middeltal defineres ved ikke
Statistik er at behandle en stor mængde af tal, så de bliver lettere at overskue og forstå.
Statistik er at behandle en stor mængde af tal, så de bliver lettere at overskue og forstå. Hvis man fx samler de karakterer, der er givet til en eksamen i én stor bunke (se herunder), kan det være svært
Statistik. Peter Sørensen: Statistik og sandsynlighed Side 1
Statistik Formålet... 1 Mindsteværdi... 1 Størsteværdi... 1 Ikke grupperede observationer... 2 Median og kvartiler defineres ved ikke grupperede observationer således:... 2 Middeltal defineres ved ikke
Noter til Statistik. Lisbeth Tavs Gregersen. 1. udgave
Noter til Statistik Lisbeth Tavs Gregersen 1. udgave 1 Indhold 1 Intro 3 1.1 HF Bekendtgørelsen........................ 3 1.2 Deskriptiv statistik......................... 3 2 Ikke-grupperet Talmateriale
Statistik. Kvartiler og middeltal defineres forskelligt ved grupperede observationer og ved ikke grupperede observationer.
Statistik Formålet... 1 Mindsteværdi... 1 Størsteværdi... 1 Ikke grupperede observationer... 2 Median og kvartiler defineres ved ikke grupperede observationer således:... 2 Middeltal defineres ved ikke
Personlig stemmeafgivning
Ib Michelsen X 2 -test 1 Personlig stemmeafgivning Efter valget i 2005 1 har man udspurgt en mindre del af de deltagende, om de har stemt personligt. Man har svar fra 1131 mænd (hvoraf 54 % har stemt personligt
Deskriptiv statistik for hf-matc
Deskriptiv statistik for hf-matc 75 50 25 2018 Karsten Juul Deskriptiv statistik for hf-matc Hvad er deskriptiv statistik? 1.1 Hvad er deskriptiv statistik?... 1 1.2 Hvad er grupperede og ugrupperede data?...
Grupperede observationer et eksempel. (begreber fra MatC genopfriskes og varians og spredning indføres)
Grupperede observationer et eksempel. (begreber fra MatC genopfriskes og varians og spredning indføres) Til Gribskovløbet 006 gennemførte 118 kvinder 1,4 km distancen. Fordelingen af kvindernes løbstider
Deskriptiv statistik for matc i stx og hf
Deskriptiv statistik for matc i stx og hf 75 50 25 2019 Karsten Juul Deskriptiv statistik for matc i stx og hf Hvad er deskriptiv statistik? 1.1 Hvad er deskriptiv statistik?... 1 1.2 Hvad er grupperede
2. Ved et roulettespil kan man vinde 0,10,100, 500 og 1000 kr. Sandsynligheden for gevinsterne ses af følgende skema:
Der er hjælp til opgaver med # og facit på side 6 1. Et eksperiment kan beskrives med følgende skema: u 1 2 3 4 5 P(u) 0,3 0,2 0,1 0,2 x Bestem x og sandsynligheden for at udfaldet er et lige tal.. 2.
5. Statistik. Hayati Balo,AAMS. 1. Carstensen, Frandsen og Studsgaard, stx mat B2, systime
5. Statistik Hayati Balo,AAMS Følgende fremstilling er baseret på 1. Carstensen, Frandsen og Studsgaard, stx mat B2, systime 1. Ugrupperede Observationer Hvis der foreligger et antal målinger eller observationer
Deskriptiv statistik. Version 2.1. Noterne er et supplement til Vejen til matematik AB1. Henrik S. Hansen, Sct. Knuds Gymnasium
Deskriptiv (beskrivende) statistik er den disciplin, der trækker de væsentligste oplysninger ud af et ofte uoverskueligt materiale. Det sker f.eks. ved at konstruere forskellige deskriptorer, d.v.s. regnestørrelser,
Ved et folketingsvalg eller en folkeafstemning spørger man alle stemmeberettigede, og kun en del af dem stemmer.
Matematik C (må anvendes på Ørestad Gymnasium) Statistik Statistik er bearbejdning af talmaterialer, der ofte indeholderstore mængder af tal. De indsamles og registreres i mange forskellige sammenhænge
for gymnasiet og hf 2017 Karsten Juul
for gymnasiet og hf 75 50 5 017 Karsten Juul Statistik for gymnasiet og hf 017 Karsten Juul 5/11-017 Nyeste version af dette hæfte kan downloades fra http://mat1.dk/noter.htm Hæftet må benyttes i undervisningen
for gymnasiet og hf 2016 Karsten Juul
for gymnasiet og hf 75 50 5 016 Karsten Juul Statistik for gymnasiet og hf Ä 016 Karsten Juul 4/1-016 Nyeste version af dette håfte kan downloades fra http://mat1.dk/noter.htm HÅftet mç benyttes i undervisningen
for matematik pä B-niveau i hf
for matematik pä B-niveau i hf 75 50 5 016 Karsten Juul GRUPPEREDE DATA 1.1 Hvad er deskriptiv statistik?...1 1. Hvad er grupperede og ugrupperede data?...1 1.1 Eksempel pä ugrupperede data...1 1. Eksempel
Hvad siger statistikken?
Eleverne har tidligere (fx i Kolorit 7, matematik grundbog) arbejdet med især beskrivende statistik (deskriptiv statistik). I dette kapitel fokuseres i højere grad på, hvordan datamateriale kan tolkes
Mattip om. Statistik 2. Tilhørende kopier: Statistik 3, 4 og 5. Du skal lære om: Faglig læsning. Chance og risiko. Sandsynlighed
Mattip om Statistik Du skal lære om: Faglig læsning Kan ikke Kan næsten Kan Chance og risiko Sandsynlighed Observationer, hyppighed og frekvens Gennemsnit Tilhørende kopier: Statistik, og mattip.dk Statistik
Statistik. Statistik er analyse af indsamlet data. Det vil sige at man bearbejder et datamateriale som i matematik næsten altid er tal.
Statistik Statistik er analyse af indsamlet data. Det vil sige at man bearbejder et datamateriale som i matematik næsten altid er tal. Derved får man et samlet overblik over talmaterialet, og man kan konkludere
Taldata 1. Chancer gennem eksperimenter
Taldata 1. Chancer gennem eksperimenter Indhold 1. Kast med to terninger 2. Et pindediagram 3. Sumtabel 4. Median og kvartiler 5. Et trappediagram 6. Gennemsnit 7. En statistik 8. Anvendelse af edb 9.
Formelsamling Matematik C
Formelsamling Matematik C Ib Michelsen Ikast 2011 Ligedannede trekanter Hvis to trekanter er ensvinklede har de proportionale sider (dvs. alle siderne i den ene er forstørrelser af siderne i den anden
Formelsamling. Ib Michelsen
Formelsamling T = log(2) 2 log(a) Ikast 2016 Ib Michelsen Ligedannede trekanter Hvis to trekanter er ensvinklede, har de proportionale sider (dvs. alle siderne i den ene er forstørrelser af siderne i den
brikkerne til regning & matematik statistik preben bernitt
brikkerne til regning & matematik statistik 2+ preben bernitt brikkerne til regning & matematik statistik 2+ 1. udgave som E-bog ISBN: 978-87-92488-33-6 2009 by bernitt-matematik.dk Kopiering af denne
Huskeliste Printark. U4 Tastetider U5 Hvor hurtigt regner du? E4 Begreber og fagord - Statistik. Materialer. Mobiltelefon Stopur
Statistik - Lærervejledning Om kapitlet I dette kapitel om statistik skal eleverne arbejde med statistik og lære at indsamle, beskrive, bearbejde og præsentere store mængder af tal og data. I kapitlet
Deskriptiv statistik. for C-niveau i hf. 2015 Karsten Juul
Deskriptiv statistik for C-niveau i hf 75 50 25 2015 Karsten Juul DESKRIPTIV STATISTIK 1.1 Hvad er deskriptiv statistik?...1 1.2 Hvad er grupperede og ugrupperede data?...1 1.21 Eksempel pä ugrupperede
Antal timer 19 5 7 10 0 6 6 3 7 6 4 14 6 5 12 10 Køn k m k m m k m k m k k k m k k k
Statistik 5 Statistik er en meget omfattende matematisk disciplin, og den anvendes i meget stor udstrækning i vores moderne samfund. Den handler om at analysere et (ofte meget stort) talmateriale. Det
Løsninger til kapitel 1
Opgave. a) observation hyppighed frekvens kum. frekvens 2,25,25 3,875,325 2 3,875,5 3 3,875,6875 4,625,75 5,625,825 6,,825 7 2,25,9375 8,,9375 9,625, Frekvenser illustreres i et pindediagram,2,8,6,4,2,,8,6,4,2
statistik og sandsynlighed
brikkerne til regning & matematik statistik og sandsynlighed trin 2 preben bernitt brikkerne statistik og sandsynlighed 2 1. udgave som E-bog ISBN: 978-87-92488-20-6 2004 by bernitt-matematik.dk Kopiering
Grupperede observationssæt Deskriptiv statistik: Middelværdi, frekvensfordeling, sumkurve, kvartilsæt, boxplot
Grupperede datasæt: Middelværdi, intervalfrekvens og kumuleret frekvens. Bilbestandens alder i 2005 fremgår af følgende tabel. Alder i år ]0;4] ]4;8] ]8;12] ]12;16] ]16;20] ]20;24] Antal i tusinde 401
Hvad er meningen? Et forløb om opinionsundersøgelser
Hvad er meningen? Et forløb om opinionsundersøgelser Jette Rygaard Poulsen, Frederikshavn Gymnasium og HF-kursus Hans Vestergaard, Frederikshavn Gymnasium og HF-kursus Søren Lundbye-Christensen, AAU 17-10-2004
Lidt historisk om chancelære i grundskolen
Lidt historisk om chancelære i grundskolen 1976 1.-2.klassetrin Vejledende forslag til læseplan:.det tilstræbes endvidere at eleverne i et passende talmaterialer kan bestemme for eksempel det største tal,
Fig. 1 Billede af de 60 terninger på mit skrivebord
Simulation af χ 2 - fordeling John Andersen Introduktion En dag kastede jeg 60 terninger Fig. 1 Billede af de 60 terninger på mit skrivebord For at danne mig et billede af hyppighederne flyttede jeg rundt
5, 10 og 1 4, 5 og 6 7, 11 og 4. 2, 3, 5 og 4 0, 1, 5 og 2 5, 2, 4 og 3. 2, 3, 4 og 1 4, 2 og 3 1, 8, 4 og 3. 5, 3 og 1 3, 4,og 5 3, 4 og 2
skrig Nr. 63 5, 0 og 4, 5 og 6 7, og 4, 3, 5 og 4 0,, 5 og 5,, 4 og 3, 3, 4 og 4, og 3, 8, 4 og 3 5, 3 og 3, 4,og 5 3, 4 og 5, 3, 3 og 7, 3 og, 4, 4 og, -, 3 og 6 6, 3, og 6 og 3, 4, 0 og 9 4 og 4 og 4
Deskriptiv statistik (grupperede observationer)
Deskriptiv statistik (grupperede observationer) Tallene er hentet fra Arbejdsbog B1 (2.udg.) eller Arbejdsbog B2, øvelse 408: Der åbnes et Lister og Regneark værksted og observationerne indtastes og navngives:
Supplerende opgaver til TRIP s matematiske GRUNDBOG. Forlaget TRIP. Opgaverne må frit benyttes i undervisningen.
48-50. Side 1 af 7 Statistik og sandsynlighedsregning ( 48-50) Opgaverne med svar starter på side 5, og deres numre har et s efter nummeret. Deres nummerering starter forfra. Svarene står fra side 6 med
Supplement til kapitel 7: Approksimationen til normalfordelingen, s. 136
Supplement til kapitel 7: Approksimationen til normalfordelingen, s. 36 Det er besværligt at regne med binomialfordelingen, og man vælger derfor ofte at bruge en approksimation med normalfordeling. Man
Statistik (deskriptiv)
Statistik (deskriptiv) Ikke-grupperede data For at behandle ikke-grupperede data i TI, skal data tastes ind i en liste. Dette kan gøres ved brug af List, hvis ikon er nr. 5 fra venstre på værktøjsbjælken
9 Statistik og sandsynlighed
9 Statistik og sandsynlighed Faglige mål Kapitlet Statistik og sandsynlighed tager udgangspunkt i følgende faglige mål: Enkeltobservationer: kunne skabe overblik over statistisk materiale og anvende udvalgte
Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik
Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Introduktion Kursusholder: Kasper K. Berthelsen Opbygning: Kurset består af 5 blokke En blok består af: To normale
Temaopgave i statistik for
Temaopgave i statistik for matematik B og A Indhold Opgave 1. Kast med 12 terninger 20 gange i praksis... 3 Opgave 2. Kast med 12 terninger teoretisk... 4 Opgave 3. Kast med 12 terninger 20 gange simulering...
Differentialregning. Ib Michelsen
Differentialregning Ib Michelsen Ikast 2012 Forsidebilledet Tredjegradspolynomium i blåt med rød tangent Version: 0.02 (18-09-12) Denne side er (~ 2) Indholdsfortegnelse Introduktion...5 Definition af
Bilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen
Bilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen Microsoft Excel har en del standard anvendelsesmuligheder i forhold til den beskrivende statistik og statistisk
Dig og din puls Lærervejleding
Dig og din puls Lærervejleding Indledning I det efterfølgende materiale beskrives et forløb til matematik C, hvori eleverne skal måle hvilepuls og arbejdspuls og beskrive observationerne matematisk. Materialet
I. Deskriptiv analyse af kroppens proportioner
Projektet er delt i to, og man kan vælge kun at gennemføre den ene del. Man kan vælge selv at frembringe data, fx gennem et samarbejde med idræt eller biologi, eller man kan anvende de foreliggende data,
Simulering af stokastiske fænomener med Excel
Simulering af stokastiske fænomener med Excel John Andersen, Læreruddannelsen i Aarhus, VIA Det kan være en ret krævende læreproces at udvikle fornemmelse for mange begreber fra sandsynlighedsregningen
Statistik. Deskriptiv statistik, normalfordeling og test. Karsten Juul
Statistik Deskriptiv statistik, normalfordeling og test Karsten Juul Intervalhyppigheder En elevgruppe på et gymnasium har spurgt 100 tilfældigt valgte elever på gymnasiet om hvor lang tid det tager dem
En lille introduktion til WordMat og statistik.
En lille introduktion til WordMat og statistik. WordMat er et gratis program som kan arbejde sammen med word 2007 og 2010. Man kan downloade programmet fra nettet. Se hvordan på linket: http://www.youtube.com/watch?v=rqsn8aakb-a
Statistisk beskrivelse og test
Statistisk beskrivelse og test 005 Karsten Juul Kapitel 1. Intervalhyppigheder Afsnit 1.1: Histogram En elevgruppe på et gymnasium har spurgt 100 tilfældigt valgte elever på gymnasiet om hvor lang tid
Lars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ 2 -test og Goodness of Fit test.
Lars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ -test og Goodness of Fit test. Anvendelser af statistik Statistik er et levende og fascinerende emne, men at læse om det er alt
statistik og sandsynlighed
brikkerne til regning & matematik statistik og sandsynlighed trin 1 preben bernitt brikkerne statistik og sandsynlighed 1 1. udgave som E-bog ISBN: 978-87-92488-19-0 2004 by bernitt-matematik.dk Kopiering
Fagårsplan 12/13 Fag: Matematik Klasse: 6.a Lærer: LBJ Fagområde/ emne
Fagårsplan 12/13 Fag: Matematik Klasse: 6.a Lærer: LBJ Fagområde/ emne Umulige figurer Periode Mål Eleverne skal: At opdage muligheden for og blive fascineret af gengivelse af det umulige. At få øvelse
bernitt-matematik.dk Fjordvej Holbæk
statistik basis+g 1 brikkerne statistik G 1. udgave som E-bog ISBN: 978-87-92488-19-0 2004 by bernitt-matematik.dk Kopiering af denne bog er kun tilladt efter aftale med bernitt-matematik.dk Læs nærmere
Regnetest B: Praktisk regning. Træn og Test. Niveau: 9. klasse. Med brug af lommeregner
Regnetest B: Praktisk regning Træn og Test Niveau: 9. klasse Med brug af lommeregner 1 INFA-Matematik: Informatik i matematikundervisningen Et delprojekt under INFA: Informatik i skolens fag Et forskningsprogram
Løsning til opgave 7, 9, 10 og 11C Matematik B Sommer 2014
Vejledning til udvalgte opgave fra Matematik B, sommer 2014 Opgave 7 Størrelsen og udbudsprisen på 100 fritidshuse på Rømø er indsamlet via boligsiden.dk. a) Grafisk præsentation, der beskriver fordelingen
Statistik og sandsynlighed
Statistik og sandsynlighed Statistik handler om at beskrive og analysere en stor mængde data. som I eller andre har indsamlet. Det kan fx være tal, der fortæller om, hvor mange lynnedslag der er i Danmark
2 -test. Fordelingen er særdeles kompleks at beskrive med matematiske formler. 2 -test blev opfundet af Pearson omkring år 1900.
2 -fordeling og 2 -test Generelt om 2 -fordelingen 2 -fordelingen er en kontinuert fordeling, modsat binomialfordelingen som er en diskret fordeling. Fordelingen er særdeles kompleks at beskrive med matematiske
Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning
Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning Introduktion Kasper K. Berthelsen, Inst f. Matematiske Fag Omfang: 8 Kursusgang I fremtiden
Under 63 år : 92% Under 55 år : 55% Ved at trække den nederste fra den øverste af de to grupper fås: Melllem 55 og 63 år :
1 501 Sumkurven viser aldersfordelingen for lærerne på et gymnasium. a) Hvor mange procent af lærerne er mellem 55 og 63 år? (Benyt gerne bilaget til at dokumentere svaret.) Løsning: Under 63 år : 92%
Nogle emner fra. Deskriptiv Statistik. 2011 Karsten Juul
Nogle emner fra Deskriptiv Statistik 75 50 25 2011 Karsten Juul Indhold Hvad er deskriptiv statistik?... 1 UGRUPPEREDE OBSERVATIONER Hyppigheder... 1 Det samlede antal observationer... 1 Middeltallet...
Statistik viden eller tilfældighed
MATEMATIK i perspektiv Side 1 af 9 DNA-analyser 1 Sandsynligheden for at en uskyldig anklages Følgende histogram viser, hvordan fragmentlængden for et DNA-område varierer inden for befolkningen. Der indgår
3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.
PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve
Lektion 9s Statistik - supplerende eksempler
Lektion 9s Statistik - supplerende eksempler Middelværdi for grupperede observationer... Summeret frekvens og sumkurver... Indekstal... Lektion 9s Side 1 Grupperede observationer Hvis man stiller et spørgsmål,
Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0
Hypotesetest Hypotesetest generelt Ingredienserne i en hypotesetest: Statistisk model, f.eks. X 1,,X n uafhængige fra bestemt fordeling. Parameter med estimat. Nulhypotese, f.eks. at antager en bestemt
Median, kvartiler, boksplot og sumkurver
Median, kvartiler, boksplot og sumkurver Median, kvartil, boksplot og sumkurver... 2 Opgaver... 7 Side 1 Median, kvartil, boksplot og sumkurver Medianen er det midterste af en række tal, der er skrevet
Tip til 1. runde af Georg Mohr-Konkurrencen Kombinatorik
Tip til 1. runde af - Kombinatorik, Kirsten Rosenkilde. Tip til 1. runde af Kombinatorik Her er nogle centrale principper om og strategier for hvordan man tæller et antal kombinationer på en smart måde,
Statistik - supplerende eksempler
- supplerende eksempler Grupperede observationer: Middelværdi og summeret frekv... 82b Indekstal... 82c Median, kvartil, boksplot... 82e Sumkurver... 82h Side 82a Grupperede observationer: Middelværdi
Matema10k. Matematik for hhx C-niveau. Arbejdsark til kapitlerne i bogen
Matema10k Matematik for hhx C-niveau Arbejdsark til kapitlerne i bogen De følgende sider er arbejdsark og opgaver som kan bruges som introduktion til mange af bogens kapitler og underemner. De kan bruges
(Projektets første del er rent deskriptiv, mens anden del peger frem mod hypotesetest. Projektet kan gemmes til dette emne, eller tages op igen der)
Projekt 2.4 Menneskets proportioner (Projektets første del er rent deskriptiv, mens anden del peger frem mod hypotesetest. Projektet kan gemmes til dette emne, eller tages op igen der) I. Deskriptiv analyse
Simulering af stokastiske fænomener med Excel
Simulering af stokastiske fænomener med Excel John Andersen, Læreruddannelsen i Aarhus, VIA Det kan være en ret krævende læreproces at udvikle fornemmelse for mange begreber fra sandsynlighedsregningen
Billedbehandling og mønstergenkendelse: Lidt elementær statistik (version 1)
; C ED 6 > Billedbehandling og mønstergenkendelse Lidt elementær statistik (version 1) Klaus Hansen 24 september 2003 1 Elementære empiriske mål Hvis vi har observationer kan vi udregne gennemsnit og varians
Allan C. Malmberg. Terningkast
Allan C. Malmberg Terningkast INFA 2008 Programmet Terning Terning er et INFA-program tilrettelagt med henblik på elever i 8. - 10. klasse som har særlig interesse i at arbejde med situationer af chancemæssig
Projekt 8.3 Hvordan undersøges om et talmateriale normalfordelt?
Projekt 8.3 Hvordan undersøges om et talmateriale normalfordelt? Projektet drejer sig om at udvikle en metode, til at undersøge om et givet talmateriale med rimelighed kan siges at være normalfordelt.
Løsning til eksaminen d. 14. december 2009
DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,
Mikro-kursus i statistik 1. del. 24-11-2002 Mikrokursus i biostatistik 1
Mikro-kursus i statistik 1. del 24-11-2002 Mikrokursus i biostatistik 1 Hvad er statistik? Det systematiske studium af tilfældighedernes spil!dyrkes af biostatistikere Anvendes som redskab til vurdering
J E T T E V E S T E R G A A R D
BINOMIALT EST J E T T E V E S T E R G A A R D F I P B I O L O G I M A R S E L I S B O R G G Y M N A S I U M D. 1 3. M A R T S 2 0 1 9 K A L U N D B O R G G Y M N A S I U M D. 1 4. M A R T S 2 0 1 9 HVEM
Velkommen til Flemmings store Maplekursus 1. lektion. Skift mellem tekst- og matematikmode
Velkommen til Flemmings store Maplekursus 1. lektion. Skift mellem tekst- og matematikmode Man kan skifte mellem tekst- og matemamatikmode ved at trykke på F5. I øjeblikket er jeg i tekstmode.. 2. lektion.
Modellering med Målskytten
Modellering med Målskytten - Et undervisningsforløb i WeDo med udgangspunkt i matematiske emner og kompetencer Af Ralf Jøker Dohn Henrik Dagsberg Målskytten - et modelleringsprojekt i matematik ved hjælp
Normalfordelingen og Stikprøvefordelinger
Normalfordelingen og Stikprøvefordelinger Normalfordelingen Standard Normal Fordelingen Sandsynligheder for Normalfordelingen Transformation af Normalfordelte Stok.Var. Stikprøver og Stikprøvefordelinger
Oversigt. Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger
Introduktion til Statistik Forelæsning 2: og diskrete fordelinger Oversigt 1 2 3 Fordelingsfunktion 4 Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 017 Danmarks Tekniske Universitet 2800
for matematik pä B-niveau i hf
for matematik pä B-niveau i hf 014 Karsten Juul TEST 1 StikprÅver... 1 1.1 Hvad er populationen?... 1 1. Hvad er stikpråven?... 1 1.3 Systematiske fejl ved valg af stikpråven.... 1 1.4 TilfÇldige fejl
Undervisningsbeskrivelse
Undervisningsbeskrivelse Stamoplysninger til brug ved prøver til gymnasiale uddannelser Termin Maj-juni, 2015 Institution Frederiksberg HF Uddannelse Fag og niveau Lærer(e) HF Matematik C Kasper Jønsson
fortsætte høj retning mellem mindre over større
cirka (ca) omtrent overslag fortsætte stoppe gentage gentage det samme igen mønster glat ru kantet høj lav bakke lav høj regel formel lov retning højre nedad finde rundt rod orden nøjagtig præcis cirka
Kønsproportion og familiemønstre.
Københavns Universitet Afdeling for Anvendt Matematik og Statistik Projektopgave forår 2005 Kønsproportion og familiemønstre. Matematik 2SS Inge Henningsen februar 2005 Indledning I denne opgave undersøges,
Matematik og samfundsfag Gini-koefficienten
Erik Vestergaard www.matematikfysik.dk Matematik og samfundsfag Gini-koefficienten Den såkaldte Gini-koefficient, introduceret i 92 i en artikel af den italienske statistiker, demograf og sociolog Corrado
Statistik i basketball
En note til opgaveskrivning [email protected] 4. marts 200 Indledning I Falcon og andre klubber er der en del gymnasieelever, der på et tidspunkt i løbet af deres gymnasietid skal skrive en større
Statistik og sandsynlighedsregning
Statistik og sandsynlighedsregning DLF-Kursus Ringsted 17.-18.9 2015 Eva Rønn UCC Indhold og mål Mål At I får får overblik over statistik og sandsynlighed som fagområde i folkeskolen får indblik i didaktiske
MATEMATIK A-NIVEAU. Anders Jørgensen & Mark Kddafi. Vejledende eksempler på eksamensopgaver og eksamensopgaver i matematik, 2012
MATEMATIK A-NIVEAU Vejledende eksempler på eksamensopgaver og eksamensopgaver i matematik, 2012 Kapitel 4 Statistik & sandsynlighedsregning 2016 MATEMATIK A-NIVEAU Vejledende eksempler på eksamensopgaver
Et CAS program til Word.
Et CAS program til Word. 1 WordMat WordMat er et CAS-program (computer algebra system) som man kan downloade gratis fra hjemmesiden www.eduap.com/wordmat/. Programmet fungerer kun i Word 2007 og 2010.
Torben Rønne. Statistik. med TI InterActive
Torben Rønne Statistik med TI InterActive Indholdsfortegnelse 1 Beskrivende statistik... 3 1.1 Middelværdi, kvartilsæt og boksplot... 3 1. Histogram og sumkurve... 5 1.3 Varians og spredning... 9 Normalfordelingen...
10.1 Et lykkehjul består af 24 lige store felter med numre fra 1 til 24.
10. 10.1 Et lykkehjul består af 24 lige store felter med numre fra 1 til 24. Bestem udfaldsrummet for lykkehjulet. 10.2 En tegnestift Du putter en tegnestift i et raflebæger, ryster det godt og smider
H Å N D B O G M A T E M A T I K 2. U D G A V E
H Å N D B O G M A T E M A T I K C 2. U D G A V E ÁÒ ÓÐ Indhold 1 1 Procentregning 3 1.1 Delingsprocent.............................. 3 1.2 Vækstprocent.............................. 4 1.3 Renteformlen..............................
Statistik II 1. Lektion. Analyse af kontingenstabeller
Statistik II 1. Lektion Analyse af kontingenstabeller Kursusbeskrivelse Omfang 5 kursusgange (forelæsning + opgaveregning) 5 kursusgange (mini-projekt) Emner Analyse af kontingenstabeller Logistisk regression
OM KAPITLET ELEVFORUDSÆTNINGER STATISTIK
OM KAPITLET ELEVFORUDSÆTNINGER I dette kapitel om statistik skal eleverne arbejde med statistik og lære at indsamle, beskrive, bearbejde og præsentere store mængder af tal og data. I kapitlet er der desuden
Statistiske modeller
Statistiske modeller Statistisk model Datamatrice Variabelmatrice Hændelse Sandsynligheder Data Statistiske modeller indeholder: Variable Hændelser defineret ved mulige variabel værdier Sandsynligheder
