Statistik Ib Michelsen Ikast 2007
Forsidebilledet Collage (IM) med hjælp fra Danmarks statistik, Volsted Plantage Jagtkonsortium og Kriminalforsorgen Version 1.0 incl. Sandsynlighed 15-5-2008
Indholdsfortegnelse Indledning...195 HF-bekendtgørelsen...195 Statistik...195 Deskriptiv statistik...197 Skives ungdom...199 Deskriptorer...200 Et statistisk eksempel...201 Observationer og deskriptorer...203 Boksplot...204 Boksplot...205 Grupperede observationer...205 Histogram...207 Histogrammer og flere deskriptorer...208 Den kumulerede hyppighed...210 Sumkurven...211 Fraktiler...212 Kvartilsæt mv. for grupperede data...213 Middeltal...214 Middeltallet for grupperede data...215 Sandsynlighed...217 Spil på "sekseren"...217 Sikkert eller tilfældigt?...219 Stokastiske eksperimenter...220 Stokastisk eksperiment...220 Stokastisk variabel...221 Frekvenser og sandsynligheder...222 Grundlaget...223 Binomialfordelingen...225 Binomialforsøg...226 Binomialfordelingen...226 Estimat, Hypotese og Test...229 Estimat...229 Hypoteser...232 Test...233
Indledning I denne sidste del af bogen, skal vi beskæftige os med statistik. Men ikke kun det: det er naturligt at placere statistik i en større helhed, hvori der også indgår sandsynlighed, hypoteser, test og estimat. Men for at få overblik over, hvad der er kernestof og hvad der er supplerende stof citeres bekendtgørelsen i min gengivelse: HF-bekendtgørelsen Kursisterne skal kunne: give en statistisk behandling af et talmateriale og kunne formidle konklusioner i et klart sprog Kernestoffet er: deskriptiv statistik med grafisk præsentation og bestemmelse af simple empiriske statistiske deskriptorer Suppplerende stof omfatter: indsamling og bearbejdning af data, herunder diskussion af hypoteser og af repræsentativitet af stikprøver Statistik Og hvad betyder så ordet statistik? Statistik er videnskaben om at tilvejebringe statistikker, det vil sige: en oversigt over en stats eller staters indre forhold især hvad angår talmæssige forhold. 1 Det første eksempel om Skives ungdom falder i denne kategori selvom Skive ikke er hele Danmark. I dag bruges ordet statistikker også om andre talmæssige forhold end statens som for eksempel i firmaets salgsstatistik. Betydningen af ordet statistik er blevet bredere og dækker nu næsten en hvilken som helst (talmæssig) beskrivelse af et fænomen: vejrstatistik, vildtstatistik... Talmæssige forhold for en stat består tit af overvældende mange tal. Statistikerens arbejde i dette område er derfor ofte at koncentrere sådanne mængder af tal til et eller nogle få tal eller en overskuelig figur, for at læseren ikke skal drukne i information. Sådanne tal kaldes statistiske deskriptorer. Gennemsnitskarakteren er et eksempel på en sådan deskriptor. 1 jævnfør Ordbog over det Danske Sprog, Bind 21, Gyldendal, 1943 (1982) 195
Deskriptiv statistik
Skives ungdom Danmarks Statistik 2 er en statsinstitution, der har til opgave at indsamle og formidle oplysninger om alt mellem himmel og jord. I Statistikbanken, der er gratis og offentlig tilgængelig på Internettet, får man et indtryk af bredden ved at se på emneoversigten: Miljø og energi, Befolkning og valg, Uddannelse og kultur, Arbejdsmarked, Løn, Sociale forhold, Sundhed og retsvæsen, Indkomst, Forbrug og priser, Generel erhvervs-statistik, Landbrug, Industri, Byggeri og boligforhold, Serviceerhverv, Transport, Udenrigshandel, Nationalregnskab og betalingsbalancen, Offentlige finanser, Penge og kapitalmarked. Derfra er de følgende data hentet: på tegningen man ser hvordan: Ved hjælp af markeringerne: Skive, 0, 1, 2,... år og 2005 vælger du, hvilke data du vil se. De vises så umiddelbart på hjemmesiden eller de kan hentes ind i et regneark. Herunder ses de data, der er svaret på forespørgslen. Og derunder ses et diagram, der viser (en del af) de samme data. 2 http://www.dst.dk 199
Deskriptorer Ved en eksamen har Josephine opnået følgende karakterer: 7, 4, 4, 7, 10, 7, 7, 10, 7, 2, 4, 7, 10, 4, 7, 10, 7, 4, 12, 10. Hvis der er tale om 20 enkeltkarakterer, kan det virke uoverskueligt. Derimod synes beskeden: Josephine bestod X-eksamen med gennemsnittet 7 at være en klar besked og ofte lige så god som alle enkeltkaraktererne. Her vil vi i stedet for ordet gennemsnit bruge ordet middelværdi. Ofte vil man også være interesseret i, hvilke karakterer Josephine har fået flest af: dvs. hendes typiske karakter. "Josephine har typisk fået 7" Når vi har en række observationer, kaldes den observation (her karakter), der er flest af, typetallet. Vi kunne også sortere alle Josephines karakterer i størrelsesorden begyndende med 2, så 4, 4... og til sidst 12. Den karakter, der står midt i rækken er medianen. Er der et lige antal observationer, benytter vi middelværdien af de to midterste observationer. 200
Både middelværdi, typetal og median beskriver Josephines eksamen; de er deskriptorer. At de her blev samme tal er ikke sikkert, men at de har omtrent samme værdier er heller ikke unormalt. Hvad der er vigtigt (for os) er, at deskriptoren fortæller det vigtigste uden at vildlede. Det har nok ikke altid været tilfældet... 3 Her var det karakterer vi observerede, men det kunne have været alt muligt andet: mord på ægtefæller, længden af torsk, antal rugende ørne i Danmark, prisen på en tønde olie... Når vi har en række af sådanne (samhørende) data, kan vi give dem en statistisk behandling. Et statistisk eksempel Dette er en undersøgelse af, hvor mange timer en 8. klasse har set tv på et døgn. Observationer: Nr. 1 2 3 4 5 6 7 8 9 10 11 TV 0 0 ½ ½ ½ 1 1 1 1 1 1½ Nr. 12 13 14 15 16 17 18 19 20 21 TV 1½ 1½ 1½ 1½ 1½ 1½ 2 2 2 2½ Eleverne er nummererede (øverst), der er altså 21 elever og nederst står det antal timer, de har set tv. Observationssættets størrelse er 21. Her er medianen observation nummer 11 i ovenstående tabel, altså 1½ time. Hvis der kun havde været 20 observationer, ville medianen have været middeltallet af observation 10 og 11. Denne undersøgelse har typetal 1½ time, fordi det forekommer flest gange. Middeltallet er gennemsnittet af antal timer der ses tv, i 3 " There are three kinds of lies: lies, damned lies, and statistics. Benjamin Disraeli British politician (1804-1881) (http://www.quotationspage.com/quote/487.html) 201
dette tilfælde: Middeltallet = (0+0+½+½+½+1+1+1+1+1+1½+1½+1½+1½+1½+1½+1½+2+2+ 2+2½):21 = 25,5:21=1,21 Middelværdien af børnenes tv-kiggeri er 1,21 timer/døgn Hyppighedstabel for antal timer Observation Hyppighed Frekvens Frekvens omregnet til % 0 timer 2 2/21=0,095 0,095*100=9,5% ½ time 3 3/21=0,143 0,143*100=14,3% 1 time 5 5/21=0,238 0,238*100=23,8% 1½ time 7 7/21=0,333 0,333*100=33,3% 2 timer 3 3/21=0,143 0,143*100=14,3% 2½ time 1 1/21=0,048 0,048*100=4,8% I alt: 21 21/21=1 100% Du kan finde mere på denne hjemmeside: http://www.2thiesen.dk/matematik.php Beregn karaktergennemsnit for Ida, der fik karaktererne : 4, 7, 7, 10,10 for eleverne til en prøve, der fik karakterer Karakterer 00 02 4 7 10 12 Antal 13 25 45 68 33 7 191 karakterer Idas gennemsnitskarakter: Elevgruppens gennemsnitskarakter En sommer er der i højsæsonen solgt følgende antal vaffelis (XTR-Mega) pr. dag: 202 98, 320, 398, 265, 225, 175, 195, 285, 267, 165, 138, 185, 168, 241, 350, 375, 300, 280, 264, 277, 239. Beregn middelværdien (gennemsnittet) Find kvartilsættet Dvs: Find først medianen og så medianen for hver af de to dele af materialet over hhv. under medianen.
Observationer og deskriptorer En observation er resultatet eller svaret på en undersøgelse ofte et tal. Symbolsk skrives det ofte x i, hvor i står for et eller andet nummer 1, 2, 3... og x i så er værdien af den i'te observation. Et observationssæt er alle de samhørende tal: {x 1 ; x 2 ; x 3 ;... x n } Observationssættets størrelse (n) er antallet af observationer; ofte gives de enkelte observationer numre fra 1 til n som ovenfor. Observationerne kan antage en række mulige værdier; for hver af disse kan vi opgøre, hvor mange af vore observationer, der er lig med denne værdi. Dette er hyppigheden (af denne værdi.) Hyppigheden (h) omregnes ofte til en frekvens (f) således: f = h n Det normale er at angive brøken som decimalbrøk med 2 eller 3 cifre efter kommaet. Frekvensen kan også angives i procent: f = h n 100 % Middeltallet x= x x... x 1 2 n x i = n n Typetallet er den hyppigste observation Medianen er den midterste observation, når observationerne er ordnet efter størrelse. Er der to i midten (når n er lige), benyttes middeltallet af disse to. Nedre kvartil findes som medianen men kun i den første halvdel af observationerne (sorteret i voksende rækkefølge.) Ved ulige antal ses der bort fra midterste observation. Øvre kvartil findes på tilsvarende måde blandt de største observationer. Kvartilsættet er mængden bestående af nedre kvartil (= 1. kvartil), median (= 2. kvartil) og øvre kvartil (=3. kvartil). 203
Boksplot Ved hjælp af en simpel tegning (et boksplot eller på dansk: en kassetegning) kan der gives megen information om en række data på en overskuelig måde: I superligaen 2006-7 var målscoren pr. kamp i de første 3 runder, som det fremgår af tabellen: 1 3 5 2 4 3 5 3 1 1 3 4 2 4 1 4 2 3 Disse data sorteres efter størrelse (voksende): 1 1 1 1 2 2 2 3 3 3 3 3 4 4 4 4 5 5 Det ses, at der er resultater fra 18 kampe. Ifølge definitionen fås medianen så som middeltallet af det 9. og det 10. resultat: Medianen = (3+3)/2 = 3 Der er 9 tal til venstre i (den grønne) tabels første halvdel: Det midterste af disse er 1. kvartil: 1. kvartil = 2 Tilsvarende fås: 3. kvartil = 4 Kvartilsættet bliver så Kvartilsæt = { 2; 3; 4 } Kvartilsættet sammen med mindste og største observation benyttes til at illustrere målscoren i superligakampe i Superligaens første 3 runder i efteråret 2006: 1. - 3. runde Mål i superligaen efteråret 2006 0 1 2 3 4 5 6 Antal mål Figuren læses således: Der er markeret en almindelig x-akse (som her er inddelt fra 0 til 6) Observationerne er i eksemplet antal mål pr. kamp Den mindste observation er 1 og den største 5 Kvartilsættet {2;3;4} er benyttet til at tegne den midterste grøn/blå firkant, hvor farveskiftene markerer kvartilerne. Det fremgår fx, at i den mest målfattige fjerdedel af kampene, blev der scoret et eller to mål. 204
Boksplot Et boksplot er en figur, der med en boks (= rektangel) viser kvartilerne samtidig med største og mindste observation. Bemærkning: Der er markeret en sædvanlig x-akse, men der er ingen y-akse. Kassens "højde" har ingen betydning. Læsbarheden er nok bedst, hvis tegningen placeres lidt over x-aksen; evt. kan der placeres flere boksplots over hinanden for at kunne sammenligne observationssæt. Sammenligningen kan støttes af lodrette hjælpelinjer for bedre at kunne aflæse tal på x-aksen. Fortsæt eksemplet med vaffelis (3 sider tidligere) og tegn det tilsvarende boksplot. Grupperede observationer I dag vil man nemt kunne håndtere tusindvis af data opsamlet af computere eller i hvert fald indtastet på computer. Tidligere har man møjsommeligt måtte regne med papir og blyant og har derfor ved optælling grupperet sine observationer for at få en vis arbejdslettelse uden at resultaterne for beregningerne ændredes ret meget: I stedet for at Jens var 17 år 287 dage, blev han med en pind registreret fx som én tilhørende aldersgruppen 15-20 årige. Også i dag må man sommetider nøjes med at arbejde med det offentliggjorte grupperede materiale. Lad os se på et eksempel: Sukkerfabrikken På Wollesen Sukkerfabrik laver man en statistik i forbindelse med påfyldning og pakning i detailemballage: Fra kæmpemæssige lagerbeholdere hældes sukkeret automatisk gennem påfyldningsanlæg ned i tokilogramsposer. Med regelmæssige mellemrum udtages poser, som bliver 205
kontrolvejet. Formålet er at kontrollere, at anlægget virker korrekt, så kunderne ikke bliver snydt men også, at firmaet ikke forærer noget væk. Poserne vejer naturligvis ikke præcis lige meget, men er afhængig af anlæggets kvalitet og justering. Idealet er, at variationen er så lille som muligt, således at alle poser vejer mindst 2000 g, men helst ikke meget mere. Man kontrolvejer ikke samtlige poser, men nøjes med nogle få. Man regner med, at man vil opdage fejl, fejljustering og lignende (næsten) lige så hurtigt for en meget mindre omkostning. Teknikken med at udtage nogle få (her poser) af en større mængde, for at sige noget om den større mængde (her: alle posernes vægt) kaldes at udtage en stikprøve fra en population. Når vi angiver størrelsen af en observation, benytter vi ikke uendelig mange decimaler. Sommetider sker der afrunding efter 5-reglen, sommetider afrundes der kun ned. Ved beregningerne skal man være opmærksom på, hvilken afrundingsmetode der er anvendt. Wollesens Sukkerfabrik Stikprøve den 22-11 2005 kl.11:43 2036 2017 2013 1989 2017 2032 2020 2003 2004 2010 2032 2029 2043 2023 2019 2030 2012 2034 2031 2007 2011 1998 2047 2008 2007 2020 2023 2038 2019 2013 2001 2009 2013 2029 2015 2023 2017 2007 1990 2044 2037 1997 2015 2016 2039 2014 1995 2023 2039 2032 I modsætning til eksemplet med karakterer, hvor der kun er 7 forskellige, varierer sukkerposernes vægt kontinuert. Det vil sige, at inden for variationsområdet kan en pose veje hvad som helst som fx 2.008,8532576358.. g I princippet er der ikke to poser, der vejer nøjagtig det samme! I tabellen her er resultatet vist i hele gram lad os antage, at der konsekvent er rundet ned. For at få et overblik over alle vægtene i tabellen kan man gruppere materialet: det vil sige, at vi deler variations-området op i en passende mængde halvåbne intervaller (ty 206
pisk 5 15 intervaller). Vi laver derfor en tabel, der for ethvert interval angiver intervalhyppigheden, det vil her sige, hvor mange poser har en vægt, der ligger i intervallet. Intervallerne herunder i øvelsen er vist, som man ofte gør, men det bør selvfølgelig præciceres, hvor observationen fx 1990 skal placeres. Da observationen er et nedrundet tal, placeres den naturligt i intervallet 1990-2000 og ikke i intervallet 1980-1990. Af øvelsen herunder fremgår det, at vi tæller, hvor mange observationer, der falder i et bestemt interval: det er intervalhyppigheden. Ved sammenligning med andre observationssæt af en anden størrelse, kan hyppigheden ikke umiddelbart bruges til sammenligning; omregnes de derimod til intervalfrekvenser, går det fint. Interval "pinde" Intervalhyppigheder 1980-1990 l 1 1990-2000 llll 4 2040-2050 Histogram Færdiggør tabellen. Kontroller, at der er 50 observationer! Histogrammet minder om søjlediagrammet, men må ikke forveksles hermed. I søjlediagrammet står der (i princippet) under hver søjle, hvad der måles. Dvs. der er ikke tale om en alm. x-akse! I histogrammet har man et normalt retvinklet koordinatsystem, hvor x-aksen inddeles som sædvanligt!. I eksemplet her vil vi have en x-akse hvor tallene 1980; 1990;..., 2050 er markerede. Den første søjle svarende til intervallet [1980 ; 1990[ tegnes mellem 1980 og 1990, den næste mellem1990 og 2000 osv. Bemærk, at her støder nabosøjler sammen. Højden på 207
søjlen svarer til intervalhyppigheden. 4 Histogrammer og flere deskriptorer En intervalhyppighed er antallet af observationer i et bestemt interval En intervalfrekvens er den hertil svarende brøk eller procent. Et histogram er en tegning der viser hyppigheder (eller frekvenser) som søjler; søjlerne er placeret ved siden af hinanden på en sædvanlig x-akse og deres areal svarer til hyppigheden (frekvensen.) Ofte er bredden af søjlerne ens og i det tilfælde svarer søjlernes højde også til hyppighederne (eller frekvenserne.) Et typeinterval er det interval, hvor histogrammets søjle er højest. Bemærk, at hvis intervallerne ikke er lige brede, kan der være et bredere interval med flere observationer end typeintervallet. 4 Hvis alle intervallerne har samme bredde, kan højden på søjlerne afsættes som intervalhypighederne. Men hvis et interval med hyppigheden 15 er 3 gange så bredt som de andre, svarer det jo til 3 søjler med gennemsnitshyppigheden 5. I det tilfælde skal søjlehøjden være 5! Hvis du på y-aksen angiver procent som måleenhed, bør alle søjlerne være lige brede eller hvis du har en søjle med 3-dobbelt bredde, kan du opdele den i 3 søjler med stiplede linjer. Alternativt kan du opgive at benytte y-aksen som målestok for hyppighederne (frekvenserne), men i stedet tegne et lille kvadrat som svarer til fx. hyppigheden: 10 observationer (eller hvis histogrammet er baseret på frekvenser: 10 %) 208
Histogram-øvelse Færdigggør histogrammet; det handler stadig om Wollesens Sukkerfabrik. Hvis vi beregner intervalhyppighederne i procent af det samlede antal observationer (n = observationssættets 9 8 7 6 5 4 3 2 1 0 størrelse) findes intervalfrekvenserne. f([1980 ; 1990[) = 1/50 = 0,02 = 0,02*100 % = 2 % f([1990 ; 2000[) = 4/50= 0,08 = 0,08*100 % = 8 % Frekvens-øvelse antal poser 1970 1980 1990 2000 2010 2020 2030 2040 2050 2060 gram pr. pose Beregn de resterende intervalfrekvenser ved hjælp af intervalhyppighederne fra den tidligere øvelse. 209
Den kumulerede hyppighed Kumulerede intervalhyppigheder Tabellen (nogle sider før) med intervalhyppigheder, kan suppleres med en ekstra kolonne: Summerede 5 intervalhyppigheder: Ud for intervallet: [1980 ; 1990[ skrives 1, fordi: antallet af poser med en vægt, der er ligger i dette interval er 1 (her: intervalhyppigheden.) - og fordi der ikke findes poser med en mindre vægt. Dette var jo det første interval! Ud for intervallet: [1990 ; 2000[ skrives 5, fordi: antallet af poser med en vægt, der er mindre end 2000 er: Dem, der er mindre end 1990 (1) og dem, der ligger i intervallet [1990 ; 2000[ (4); i alt 1+4 = 5. Opstillet en tabel foregår beregningen ret mekanisk: Interval Intervalhyppighed Summeret intervalhyppighed 1980-1990 1 1 1990-2000 4 5 8 13 2040-2050 Den summerede (kumulerede) intervalhyppighed er antallet af observationer, der er mindre end det tilsvarende intervals højre endepunkt. For at finde resultatet 13 = 5 + 8 benyttes tallet lige over og lige til venstre for 13. De er markeret med gult. Øvelse om summerede intervalhyppigheder Beregn de resterende kumulerede hyppigheder som i skemaet herover. 5 Kumulerede eller summerede 210
Interval Intervalfrekvens Kumuleret intervalfrekvens 1980 1990 0,02 0,02 1990-2000 0,08 0,10... 2040-2050 Den summerede (kumulerede) intervalfrekvens er brøken (eller procenten) af observationer, der er mindre end intervallets højre endepunkt. Sumkurven Beregn de kumulerede intervalfrekvenser som påbegyndt i skemaet herover. Sumkurven er defineret som grafen for funktionen, der for enhver mulig observationsstørrelse (x-værdi) angiver brøken (eller procenten) af observationer, der er mindre end denne x-værdi. Overvej, at punkter, hvor x-værdien er højre endepunkt af et interval og y-værdien er den til intervallet svarende summerede intervalfrekvens, ligger på sumkurven! Tegn sumkurven herunder på mm-papir og skitser den på tegningen herunder. F(x) 1 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0 1970 1990 2010 2030 2050 211
Bemærkninger Når vi forbinder støttepunkter for sumkurven, kender vi ikke de enkelte posers vægt; i mangel af bedre viden regner vi med en jævn fordeling og derfor tegnes grafen mellem nabostøttepunkter som rette linjestykker. Fraktiler Definition: p %-fraktilen Vi har en givet sumkurve og tilsvarende funktionen F(x) p %-fraktilen er den (mindste) x-værdi, hvor F(x) = p % Bemærk: p er en y-værdi. Derfor starter du på y-aksen, tegner en vandret linje ud til grafen og fra skæringspunktet tegner du lodret ned til x-aksen, hvor du aflæser p%-fraktilen. Fraktil-øvelse Aflæs på nedenstående figur 10 %-fraktil, 25 %-fraktil, 50 %-fraktil, 75 %-fraktil, 90 %- fraktil, 94 %-fraktil, 100 %-fraktil. Sumkurve procent 100 90 80 70 60 50 40 30 20 10 0 80 100 120 140 160 x På figuren aflæses, at 54%-fraktilen = 125 212
Kvartilsæt mv. for grupperede data 25 %-fraktil kaldes 1. kvartil (eller: nedre kvartil) 50 %-fraktil kaldes 2. kvartil eller medianen 75 %-fraktil kaldes 3. kvartil (eller: øvre kvartil) Tilsammen kaldes de 3 kvartiler kvartilsættet. Skrivemåden for kvartilsættet er fx Kvartilsættet = {12 ; 17; 21} idet 1. kvartil = 12 osv. Bemærk, at denne definition bruges for grupperede observationer hvor ikke alle enkelte observationer kendes. 6 Lønstatistik 7 Fra Ledernes lønstatistik får man blandt andet oplyst følgende om lønnen for halinspektører i 2005: Ledernes lønstatistik 2005 Halinspektører Nedre Kvartil (1.) 27.200 Median 31.700 Øvre Kvartil (3.) 37.100 90 % -fraktil 45.000 Indtegn en delvist skitseret sumkurve for halinspektørernes løn på mm-papir. Hvilken månedsløn får en halinspektør, der ligger på 61 %-fraktilen? Hvilken fraktil svarer månedslønnen 28.500 kr. til? 6 Det er bestemt ikke normalt, at det samme begreb defineres på to forskellige måder, der vel at mærke giver forskellige resultater. I Danmark er der en gammel tradition for at anvende definition, der bygger på fraktiler. Denne tradition er ved at blive erstattet af den mere intuitive definition, du tidligere har set. For ikke at blive misforstået, når du anvender kvartilsæt, må du derfor tilføje, hvordan kvartilsættet er fundet: Enten ved hjælp af de tre fraktiler eller ved hjælp af de tre observationer, der deler materialet i 4 lige store dele. 7 http://www.lederne.dk/loenstat/presentation/loenstatmain.jsp 213
Lægevagten Hos lægevagten i X-købing har man lavet statistik over antallet af henvendelser, som det fremgår af skemaet under øvelsen. Tegn et histogram, der svarer til tabellens oplysninger Beregn det gennemsnitlige antal henvendelser pr. døgn Hvad er typeintervallet? Beregn frekvenserne, der svarer til hyppighederne Beregn de summerede frekvenser Tegn sumkurven Find kvartilsættet Hvor mange procent af døgnene var der færre end 125 henvendelser? Hvor mange procent af døgnene var der flere end 200 henvendelser? Tegn et boksplot Antal henvendelser pr. døgn Hyppighed 0 50 5 51 100 37 101 150 98 151 200 165 201 250 201 251 400 45 Middeltal Middeltallet x For en række observationer x, 1 x2,..., x kan middeltallet beregnes som: x1 + x2 +... + xn x = n n I forbindelse med Josephines karakterer blev gennem 214
snitskarakter omtalt som middeltal. På nøjagtig samme måde kan vi beregne middeltallet for sukkerposerne på Wollesens Sukkerfabrik hvis vi kender de individuelle vægte. x = 100.940/50 = 2.018,8 det vil sige, at poserne i gennemsnit vejer 2.018,8 gram Forudsætter vi, at poserne i gennemsnit er rundet ned med 0,5 g, skal dette lægges til så gennemsnittet bliver 2019,3 g. Ofte har man imidlertid kun de grupperede data til rådighed til beregning af middeltallet, hvilket i princippet er umuligt i henhold til ovenstående definition. Løsningen er: at lade som vi kender dem: Interval hyppigheder h midtpunkt m m*h [1980 ; 1990[ 1 1985 1.985 [1990 ; 2000[ 4 1995 7.980 [2000 ; 2010[ 8 2005 16.040 [2010 2020[ 15 2015 30.225 [2030 ; 2030[ 8 2025 16.200 [2030 ; 2040[ 11 2035 22.385 [2040 ; 2050[ 3 2045 6.135 Ialt 100.950 Middeltal = 100.950/50 2.019 Forudsætningen for rigtigheden er, at gennemsnittet for observationerne i hvert interval = intervalmidtpunktet. Det er naturligvis kun omtrent rigtigt, men så kan vi yderligere antage, at fejlene omtrent udligner hinanden. Sammenlignes resultaterne 2019,3 og 2019 ser det ud, som denne antagelse er rimelíg i hvert fald for det anførte eksempel. Middeltallet for grupperede data For en række observationer x, 1 x2,..., xn kan middeltallet beregnes som: hi mi x = n hvor det græske bogstav (store sigma) betyder, at man skal addere: her er det en række produkter; hvert produkt har faktoren h (intervalhyppigheden) og faktoren m (intervalmidtpunktet.) 215
Det er præcis denne definition, vi har anvendt ved beregningen i ovenstående tabel. Rind Dambrug På Rind Dambrug kontrolleres ørredproduktionen: Man har taget en stikprøve på 40 ørreder og vejet dem for at vurdere, om produktionen er salgsklar. Resultatet fremgår af tabellen: Rind Dambrug Kontrolvejning 15. marts 2004 436 397 455 360 425 510 448 429 395 527 460 410 399 440 480 465 411 431 439 427 446 405 426 409 427 385 437 418 411 466 408 390 471 406 418 437 414 407 435 501 Hvad er typeintervallet? Beregn middelværdien For dambruget er det selvfølgelig uden betydning, om de 40 ørreder er salgsklare men som stikprøve skal de fortælle noget om alle ørrederne, man planlægger at sælge. 216
Sandsynlighed Spil på "sekseren" Under 2. verdenskrig 8 blev der gravet brunkul i Midtjylland og der (og mange andre steder) var der smugkroer, hvor man spillede Fortuna eller på "sekseren": et populært (og ulovligt) hasardspil. 9 Spillet var uhøre enkelt: Der benyttes en spilleplade som nedenstående og 3 terninger: 1 2 3 4 5 6 Først bestemmer hver spiller sin indsats: stor eller lille efter eget ønske. Der kan sættes penge på et eller flere tal. Der kan være en eller mange spillere, der spiller mod Banken. Pengene lægges på pladen på det tal, man satser på. Antag, at du har satset 500 kroner på 2'eren. Bankøren ryster raflebægeret med de tre terninger og vender det. Regnskabet 1. Er der nul toere, er indsatsen tabt 2. Er der en toer, vinder du din indsats: altså 500 kr. fra banken (og beholder indsatsen). Tilsvarende: 3. Er der to toere, vinder du to gange 500 kr. og 8 1939-1945 9 Den, som søger erhverv ved hasardspil eller væddemål af tilsvarende art, der ikke ifølge særlig bestemmelse er tilladt, eller ved at fremme sådant spil, straffes med bøde eller fængsel indtil 1 år. Stk. 2. Retten afgør, om det vundne udbytte skal inddrages eller tilbagebetales. (Straffelovens 203) 217
4. Er der tre toere, vinder du tre gange 500 kr. Øvelse: Spil på "sekseren" Gevinst "Pinde" Hyppighed Frekvens -1 1 2 3 Antal observationer i alt Samlet gevinst (+) eller tab(-) i "sekser-kroner": I grupper på ca. 4 elever trækkes der lod: en er bankør og resten er spillere Alle - både bankør og spillere - udstyres med "matadorpenge" af læreren; spillerne får også et regnskabsark som ovenstående Der spilles nogle runder i 10-15 minutter eller indtil banken er gået konkurs eller spillerne har mistet alle deres penge. Efter hver runde (eller spil) sætter hver spiller en "pind" for at lave statistik over sit spilleforløb Efter spillet diskuterer gruppen: Hvem vil du helst være: bankør eller spiller? Hvorfor? Er det et fair spil? Kan banken gå fallit? Hvordan skal gevinsterne ændres, før du skifter mening? Hvornår er det ligemeget, om man er bankør eller spiller? Er der nogen udfald af terningekastet der er gode for banken? Findes der en god "strategi for spillerne? Sammenlign spillernes frekvenser. Ligner de hinanden? hvorfor? 218 Kan man regne ud, hvad frekvenserne omtrent bliver?
In plenum: Diskussionen samles op. Grupperne argumenterer for deres svar. Evt. udarbejdes et samlet frekvensskema for alle spillere. Find matadorpenge 10 Øvelse: Præsidentvalget Gore vs. Bush jr. De to kandidater fik ved præsidentvalget i 2000 omtrent lige mange stemmer; Gore flest i US som helhed ("the popular majority"), men valget af præsident og vicepræsident afgøres af "United States Electoral College", som består af et antal repræsentanter fra de respektive stater. Helt afgørende blev staten Florida, hvor optællingen viste næsten samme antal stemmer til hhv. demokrater og republikanere. Officielt endte optællingen med et flertal til Bush jr. på 537 i denne stat ud af 5.962.657 afgivne stemmer. Hvis Gallup eller et andet opinionsundersøgelsesinstitut skulle spå om valgresultatet, kunne det så spå rigtigt? helt sikkert? Hvis der var 6 konkurrerende institutter, der uafhængigt af hinanden spåede om resultatet, kunne de så alle spå rigtigt? Eller alle spå forkert? Hvilke kombinationer af forudsigelser ville du forvente, når du nu kender afstemningsresultatet? Se 11 Sikkert eller tilfældigt? Når man lader en terning falde fra Rundetårn kan man måle (eller se): 10 Find pengene: "Sekserpenge" 11U.S. presidential election, 2000, Florida electoral votes (Margin: 0.00901% svarende til 537 votes af 5,962,657 votes in Florida). Kilde: en.wikipedia.org 219
hvor lang tid der går fra terningen slippes til den rammer fortovet eller hvor mange øjne terningen viser. I det første tilfælde udføres et deterministisk eksperiment: vi har funktioner, der beskriver faldhøjden som en funktion af tiden. Forsøgets resultat kan beregnes før det gennemføres. Det kan gentages og resultatet bliver det samme. I det andet tilfælde udføres et stokastisk eksperiment: resultatet afhænger af tilfældigheder og kan ikke forudsiges sikkert. Dog ved vi, at terningen må vise 1, 2, 3, 4, 5 eller 6 øjne. Beskrivelsen her er sort-hvid; matematiske modeller er forenklede beskrivelser af virkeligheden. I modellen kan vi lave en serie fuldstændig ens eksperimenter, fordi vi bevidst ser bort fra det uvæsentlige i den virkelige verden. Det deterministiske eksperiment er derfor en idealforestilling fra modellernes verden. Stokastiske eksperimenter Forudsætningen er: under så vidt mulige velbeskrevne og kontrollerede omstændigheder udføres et eksperiment en eller flere gange. Eksperimenter har et udfald. For de deterministiske er der kun et muligt udfald modsat stokastiske, hvor der er flere mulige udfald. Terningekastet har 6 mulige udfald: nemlig 1, 2, 3... 6 øjne. Vi regner kun med disse 6 mulige udfald og ser bort fra, at terningen kunne gå i stykker, forsvinde eller blive stående på et hjørne. Stokastisk eksperiment Et eksperiment udføres på nøjagtig samme måde, men resultatet varierer uforudsigeligt hver gang. De mulige udfald kan beskrives som et udfaldsrum (= mængden af mulige udfald.) Den eneste viden, der haves er, at vi i det lange løb vil se et mønster i frekvenserne for observationer af forskellige udfald. 220
Stokastisk variabel Det vi måler ved et stokastisk eksperiment, kaldes en stokastisk variabel. Et eksempel kunne være gevinsten ved et enkelt spil i et kasino på en roulette. Eller gevinsten (- snarere tabet) ved 100 spil. Eller hvor mange gange ud af 100 kuglen lander på "ulige". Bemærk, at det udfald vi observerer kan være farven (rød eller sort), men i samme eksperiment kan man også observere for eksempel nummeret (1-36) eller lige/ulige. Øvelse: Stokastisk variabel Hvis det "stokastiske eksperiment" er et spil på "sekseren": Find to forslag til en stokastisk variabel! Eksempel Fra en serie på 1000 terningeslag er der i tabellen herunder vist frekvensen af 6 ere for det første eksperiment, for de 2 første,... og for de 10 første: Slag Frekvens 1 2 3 4 5 6 7 8 1,00 0,50 0,33 0,25 0,20 0,33 0,29 0,38 9 10 0,33 0,40 Diagrammet herunder viser grafisk hvorledes (i dette tilfælde) frekvensen nærmer sig et tal i nærheden af 1/6; faktisk er den sidst målte frekvens 0,172 (og 1/6 = 0,167). Frekvens af 6'ere 1 0,8 0,6 0,4 0,2 0 0 200 400 600 800 1000 Terningeslag 221
De 6 mulige udfald for terningekastet er en mængde, der kaldes udfaldsrummet. I udfaldsrummet kan vi udvælge vilkårlige delmængder som slag med 5 og 6 øjne. I eksemplet her er Udfaldsrummet = U = {1; 2; 3; 4; 5; 6} Delmængden = D = {5; 6} Udfaldsrum Delmængde Udfald Frekvenser og sandsynligheder Når en række eksperimenter har fundet sted, kan vi med hyppigheder og frekvenser beskrive eksperimenterne. Dertil benyttes teknikken fra den deskriptive statistik. Når vi ser, hvorledes frekvenser (for et bestemt udfald) ser ud til at nærme sig et bestemt tal mellem 0 og 1, når serien af eksperimenter bliver længere og længere, kunne man forestille sig, at der fandtes et sådant bestemt tal, som vi kunne kalde P 12. På den baggrund er der opbygget en teori til beskrivelse af stokastiske eksperimenter, der tager udgangspunkt i: at der findes en funktion, der til enhver begivenhed (svarende til delmængder eller enkelte udfald) kan angives en funktionsværdi mellem 0 og 1 (dvs. sandsynligheden for begivenheden.) Teorien hviler på nogle grundsætninger (jævnfør og sammenlign med Euklids Elementer) som ikke (kan) bevises, men som er inspireret af frekvenser. Herfra udledes så teorien om sandsynligheder. Men hvor Euklids aksiomer har langt over 2000 år på bagen er de tilsvarende for sandsynlighedsteorien under 200 år. 12 P anvendes som generel forkortelse for sandsynlighed (fra engelsk Probability.) 222
Selvom teorien er matematisk sand er den jo kun et idealiseret billede af den virkelige verden, og den er kun interessant for andre end matematikere, hvis den leverer et brugbart billede af den virkelige verden. Historisk set er det som skrevet overvejelser om udfald af spil, der starter sandsynlighedsregningen. Tidligt gives udfaldet 6 øjne i et terningeslag sandsynligheden 1/6. Ikke fordi man havde eksperimenteret med (næsten) uendelig lange serier af terningekast, men fordi det synes logisk. Af symmetrigrunde. Det kaldes en a priori viden. På et senere tidspunkt interesserer statistikere sig for demografi (befolkningslære.) I den sammenhæng kan en fødsel betragtes som et stokastisk eksperiment med to mulige udfald: dreng eller pige. Hvis man brugte et symmetriprincip kunne sandsynligheden for at få en dreng være 0,50 eller 50%. Men erfaringen viser, at der fødes flere drenge end piger, og at frekvensen af drenge i forhold til samtlige fødte er uhyre konstant. Sandsynligheden for at få en dreng kan så opfattes som den ukendte brøk, den målte frekvens er tæt på og påstås det nærmer sig. I modsætning til a priori kaldes dette a posteriori viden. Grundlaget Lad os præcisere og opsummere grundlaget: Vi beskæftiger os med stokastiske eksperimenter og benytter her terningekastet som eksempel. I forbindelse med eksperimentet defineres en stokastisk variabel: X. Ved et kast tælles terningens øjne. Udfaldet der vises 2 øjne, skrives ofte X=2. Vi definerer en funktion P. Definitionsmængden for P er enhver delmængde D af udfalds-rummet U. Til sammenligning med tidligere funktioner: Her bruges altså bogstavet P i stedet f eller g eller... D erstatter x; istedet for bogstavet D kan der være en beskrivelse af delmængden med almindelige ord. 13 13 Bemærk, at forskellige delmængder godt kan have en eller flere udfald fælles. 223
f(x) erstattes så af P(D) 14 Udfald Udfaldsrum Delmængde Der er tegnet en delmængde (den røde ring) som et eksempel og for hver ring, der overhovedet kan tegnes, har vi en delmængde, der må have en sandsynlighed. For P gælder: P(U) = 1 Reglen siger, at det er sikkert, at vi får et af de mulige udfald. Anvendt på eksemplet er U = {1; 2; 3; 4; 5; 6} Påstanden læses: Sandsynligheden for at få et af udfaldene i U (altså fra 1 til 6 øjne) er 1 eller 100%. 0 P(D) 1 Påstanden læses: Sandsynligheden for et udfald i delmængden D (som kan være udfald med 5 øjne eller udfald med et lige antal øjne eller udfald med højst 2 øjne..) ligger mellem 0 og 1. P( ) = 0 er den tomme mængde; den indeholder ikke nogen udfald fra udfaldsrummet. X kan derfor ikke få en værdi fra. Hvis D 1 D 2 =, gælder: P(D 1 D 2 )=P(D 1 )+ P(D 2 ) Forudsætningen er: De to delmængder har ingen fælles udfald. I eksemplet kunne de to delmængder være hhv. D 1 ={1; 3} og D 2 ={4; 5}. Så er D 1 D 2 = {1; 3; 4; 5} 14 D kan altså skrives som X>2 eller ulige antal øjne... 224
Øvelse: Find delmængder Tænk på kast med en terning. Skriv udfaldsrummet op. En delmængde kan være: {1, 5, 6}. Skriv så mange delmængder op, som du kan, i løbet af 2 minutter. Beskriv nogle af dem med ord og nogle med X og tegn som <, >, =. Øvelse: Empirisk begrundede sandsynligheder (a posteriori) Claus Binger skyder med bue og pil mod en skive med et centrum og 3 ringe udenom: Ifølge hans egen statistik regner han med følgende sandsynligheder: Binomialfordelingen Claus rammer Claus skyder forbi Udfald Centrum 1. Ring 2. Ring 3. Ring Forbier P 0,30 0,40 0,25 0,05 0,00 Hvad er P(Claus rammer 1. ring) =? Hvad betyder det? 1 år senere ville Claus have ændret skemaet til: Claus rammer Claus skyder forbi Udfald Centrum 1. Ring 2. Ring 3. Ring Forbier P 0,35 0,45 0,02 0,00 Hvad er så nu P(Claus rammer 2. ring) =? Er han blevet bedre eller dårligere? Kan det måles? Lad os tænke på et eksperiment, hvor der kun er to mulige udfald: succes og fiasko. Det kan være: 1. spillet: plat eller krone 2. terningekast, hvor et bestemt antal øjne udnævnes til succes 3. fødsel, hvor fødsel af et udvalgt køn (ikke nødvendigvis det samme i alle subkulturer) kaldes succes. 225
Binomialforsøg Et eksperiment med 2 mulige udfald kaldes et binomialforsøg. Kaldes sandsynligheden for det første udfald (=succes) p, giver det sig selv, at sandsynligheden for det andet udfald (=fiasko) er 1-p. Udfald Succes Fiasko P p 1-p Forestil dig, at du gentager et sådant forsøg 10 gange eller n gange. De 10 eller n eksperimenter udgør også et samlet eksperiment, hvor man kan tælle antallet af successer. Dette tal er en stokastisk variabel X, som siges at følge binomialfordelingen 15 : Binomialfordelingen X følger en binomialfordeling, hvis X er en stokastisk variabel, der tæller antal succeser i n binomialforsøg. Det skrives: X ~ b(n;p) hvor U = {0; 1; 2; 3;... ; n-1; n} og b minder om, at det er en binomialfordeling; n er antallet af binomialforsøg og p er sandsynligheden for succes i det enkelte binomialforsøg. Hvis X ~ b(10;0,5) tæller X antal succeser når vi laver et binomialforsøg 10 gange; i hvert af forsøgene er sandsynligheden for succes 0,5 = 50%. P(X=3) betyder: sandsynligheden for at få 3 succeser blandt de 10 binomialforsøg. 15 "Bi" betyder noget med to; kendes fra: Urbino (italiensk bynavn: to byer), bismag, birolle og biseksuel. 226
Øvelse Binomialfordeling I Lad X~b(10 ; 0,5). Hvor uheldige kan vi være? hvad er det mindste antal succeser, vi kan få? Hvad er det største antal? Hvad er udfaldsrummet U =? Hvis du skulle gætte på et antal succeser før du lavede de 10 forsøg: hvad ville du så gætte på? Prøv at slå plat og krone 10 gange; tæl kroner (=succes.) Fik du hvad du gættede på? Hvis ja: sker det også næste gang? Hvis nej: hvad vil du nu gætte på, hvis du gentager forsøget? Ved hjælp af lommeregner, tabeller eller regneark er det muligt at finde punktsandsynlighederne (dvs. sandsynligheden for det enkelte udfald) eller for en delmængde af udfaldsrummet. Sandsynlighederne kan beregnes med regnearket: Binomialfordeling. (Se øvelserne herunder) Øvelse Binomialfordeling II Forklar med egne ord, hvad der kan læses i skemaerne herunder. Beregn følgende sandsynligheder, idet vi forudsætter X~b(12; 0,3) P(X=0) P(X<4) P(X 10) P(3,5 X 10 ) P(X>0) P(X er ikke 11) P(X=a) n= 10 p= 0,2 a= 4 P(X=a) 0,0881 P(X<=a) n= 10 p= 0,2 a= 4 P(X<=a) 0,9672 P(a<=X<=b) n= 10 p= 0,2 a= 3 b= 6 227
Øvelse Tordenskjold Tordenskjold havde 11 brødre og 6 søstre. Hvis hver fødsel er et eksperiment med sandsynligheden 0,51 for at få en dreng: Hvad er så hr. og fru Wessels sandsynlighed for at få netop denne kombination af piger og drenge (givet antal fødsler)? Hvad er sandsynligheden for at få mindst 12 sønner ved 18 enkeltbarnsfødsler? Øvelse Gallup Ved en Gallupundersøgelse udspørges 1200 vælgere, om de vil stemme på partiet W. 70 vælgere svarer, at de vil stemme på partiet. Partiet hævder, at det vil få 7% af stemmerne ved næste valg. Hvad mener du? Øvelse Cola Når man vil teste, om en gruppe mennesker kan smage forskel på 2 produkter (som for eksempel forskellige varianter af cola), kan man lave følgende binomialforsøg: Hæld cola op i 3 glas således at indholdet i de 2 glas er det samme, men det tredie glas indeholder den anden cola. Forsøgspersonen ved ikke, hviket glas der har et andet indhold end de to andre. Forsøgspersonen bliver nu bedt om at udpege det glas, der smager anderledes. Hvorfor er dette et binomialforsøg? Hvis forsøgspersonen kan pege på det rigtige glas, er udfaldet en succes. Hvad er p i binomialforsøget, hvis forsøgspersonen bare gætter? Hvad er p i binomialforsøget, hvis forsøgspersonen sikkert kan smage forskel? Da binomialforsøget blev gentaget 12 gange fik vi 5 rigtige svar. Kan forsøgspersonen (eller forsøgspersonerne) sikkert smage forskel på de 2 colaer? (Meget let spørgsmål!) Kan det tænkes, at de alle bare har gættet? 228
Øvelse: Sprogbrug Estimat, Hypotese og Test Estimat Hvorfor er det rimeligt at sige, at sandsynligheden er 2/3 for at få mindst 3 i et terningekast med en sædvanlig terning? Hvad er så sandsynligheden for at få mindst 3 mindst 6 gange af 10 kast? Hvis det lyder knudret skal du prøve at slå 10 slag; for hver slag noterer du, om du fik mindst 3? Så var det slag en succes! Hvor mange succeser fik du ialt? Var det mindst 6 gange? Prøv så at besvar spørgsmålet igen. Eksempel: Opinionsundersøgelser og estimater Når Gallup, Observa, Sonar eller andre spørger 1400 udvalgte personer (stikprøven), hvilket parti de vil stemme på ved næste folketingsvalg (og hvilken sæbe, de vasker sig med - og hvilken filmstjerne de drømmer om og mange andre interessante forhold), er det ikke fordi man er interesseret i netop disse menneskers meninger og vaner. Man spørger, fordi man tror, at man ved hjælp af svarene kan få noget at vide om hele befolkningens (populationens) holdning til fx de politiske partier. Interessant for partierne er det at få oplyst, hvilken procentdel af befolkningen, der pt. vil stemme på dem. Det kan man ikke få at vide uden at spørge alle - og det er for dyrt. Men ved hjælp af stikprøven, kan vi gætte - og forhåbentligt fornuftigt. I vores eksempel vil vi gerne kende procenten (eller brøken) p, som fortæller om den brøkdel af stemmerne et parti vil opnå. p er altså et ganske bestemt tal - i denne sammenhæng. Ved hjælp af stikprøven kan vi regne mange forskellige tal ud; for eksempel den brøk i stikprøven, der har villet stemme på det pågældende parti. Vi gætter på, at dette tal 229
er tæt på det rigtige. Sådanne gæt kaldes estimater, og i princippet kan de vise det fuldstændigt rigtige svar, et omtrent rigtigt svar og noget fuldstændigt forkert. Men estimatet er hverken det samme hver gang og der er ingen garanti for, at det er "tæt" ved tallet vi søger. Estimatet er et resultat af et stokastisk eksperiment, hvor vi konstruerer en (særlig) stokastisk variabel (kaldet estimatoren): den tilfældige værdi af denne er estimatet. Lad os antage, at vi ved, at partiet NN har en vælgertilslutning på 30 %, og at vi laver en miniopinionsundersøgelse ved at spørge 10 tilfældigt udvalgte personer. Hvis stikprøven skal ligne populationen, skal der være 3 i stikprøven, der vil stemme på partiet. Men tilfældet er en skælm: Der kan jo være alt fra 0 til 10, der siger ja. Og selv om vi ved, at X~b(10; 0,3) kan vi komme til at gætte på, at parameteren p = 0,0; 0,1; 0,2;... ; 0,9; 1,0. I den følgende øvelse vil vi vurdere, hvor gode gæt er under forskellige omstændigheder. En vigtig pointe ved disse undersøgelser er, at alle i befolkningen skal have nøjagtig den samme chance for at være med. Ellers bliver undersøgelsen misvisende. Og det er sket utallige gange. Hvordan man sikrer sig dette - så godt som muligt - er en større videnskab, og behandles ikke her. 230
Øvelse: Vurder værdi af estimat r Idet du benytter regnearket: http://pc-p4.mimimi.dk/ss/binomialfordelingen_fx.xls besvares spørgsmålene herunder. Udskriv histogrammerne. Vi spørger 200 personer og "ved", at der i befolkningen er 30 % (dvs. p=0,3) Indtast værdierne i regnearket der svarer hertil, så du får tegnet et histogram (med de teoretiske frekvenser.) Hvad er de typiske udfald af eksperimentet? Hvilke værdier af p svarer det til? Hvad er P(46<X<50))? Hvad er P(43<X<50))? Hvor tit vil det ske, at selvom om p=0,30, vil man gætte på, at værdien er 0,25 eller mindre? Besvar det sidste spørgsmål igen ved forskellige stikprøvestørrelser: n=100, 400, 1600. Sæt alle svarene ind i en tabel med to rækker. Øverst er x-værdier: stikprøvestørrelsen, og nederst y-værdier: de tilsvarende brøker fundet i pkt. e og f. Indtegn resultatet fra g i et koordinatsystem på. Hvad observerer du? Kan du forklare, hvorfor alle undersøgelser af denne type benytter stikprøver i størrelsen fra 700 til 1500? Teoretisk set er der ingen søjler i histogrammerne, der har højden 0%, men i praxis ser det sådan ud. Prøv at lave en tabel, hvor n = 100, 200,... 1600 står i x-rækken og tallet i y-rækken beregnes sådan: I hvert histogram findes den største x- værdi, hvor det kan ses, at søjlen ikke er nul. Tilsvarende findes den mindste x-værdi, hvor det kan ses, at søjlen ikke er nul. De to tal trækkes fra hinanden; forskellen er y- værdien. Kan vi beskrive sammenhængen mellem x og y med en pæn funktion? 231
Hypoteser Når nogen fremsætter en påstand, kaldes det her en hypotese. Hypoteser kan være sande eller falske og vi kan tro på dem eller lade være med at tro på dem. Øvelse: Muligheder for en hypotese Hypoteser Udfyld skemaet, så ovenstående muligheder står klart. Hvilke af mulighederne er "gode" og hvilke er "uheldige"? Eksempler på hypoteser kan være: 1. 13 % af de stemmeberettigede vil pt. stemme på partiet X. 2. 95 % af sukkerposerne vejer over 2000 g 3. Der er gevinst på hver 10. lodseddel I forbindelse med hver af hypoteserne vil der så være en alternativ hypotese: at hypotesen ikke er rigtig. I det første eksempel er den alternative hypotese: Nej der er ikke 13 %, men færre (flere.) Om man vil bruge færre eller flere afhænger selvfølgelig af, hvem der fremsætter påstanden; er det partiets presseafdeling eller spindoktor, vil man formode, at han vil tegne et optimistisk billede af situationen og evt. overdrive tilslutningen. Så benyttes færre. 232
Test Når man undersøger en hypotese, kaldes det at teste hypotesen. En test går ud på at gennemføre et eksperiment, regne med at den oprindelige hypotese er sand og derefter vurdere, om udfaldet af eksperimentet er sandsynligt i den givne model. Hvis resultatet er usandsynligt; dvs. kun sker for eksempel 1 ud af 100 gange, vil vi forkaste hypotesen, dvs. vi tror ikke påstanden er sand. Men vi ved godt, at en gang i mellem sker det usandsynlige (som for eksempel at vinde den store milliongevinst.) Men det regner vi ikke med til daglig. Så en gang i mellem begår vi fejl. Hvis resultatet ikke er usandsynligt (og det er noget andet end sandsynligt!!) forkaster vi ikke hypotesen. Den kan være rigtig eller nogenlunde rigtig. Vi ved i hvert tilfælde ikke nok til at afvise den. Og også her kan vi begå en fejl ved ikke at forkaste en forkert hypotese; hypotesen er bare ikke nok forkert til at vi med sikkerhed kan afvise den. Eksempel på hypotese og test Lad partiet W hævde, at deres tilslutning blandt vælgerne er 7 %. Vi lader nu Observa spørge 1000 tilfældigt udvalgte vælgere, om de vil stemme på W. Vi går ud fra en masse urealistiske forhold vedrørende modellen: At de udspurgte er tilfældigt udvalgte blandt alle stemmeberettigede At alle vil svare og svarer At de svarer ja eller nej At de svarer ærligt At vi kan bruge en binomialfordeling som beskrivende model At modellen i dette tilfælde er: X~b(1000 ; 0,07) 233
Hypotesen (kaldet Ho) er: p = 0,07 Den alternative hypotese er: p < 0,07 Vi får nu svaret fra Observa: 1. Antag svaret er: 41; hvis påstanden om p = 0,07 er rigtig, kan vi med binomialfordelingen beregne, at dette resultat (eller noget der er endnu ringere) kun indtræffer i 0,01 % af alle tilfælde. 2. Derfor forkastes hypotesen; vi tror ikke at Observas undersøgelse har ramt et så forkert resultat vel vidende, at det sker en gang i mellem. 3. Hvis svaret i stedet for havde været 55, kunne man tilsvarende beregne, at det sker i 3,3 % af alle tilfælde; hvis W har været meget uheldig, kan deres påstand godt være rigtig og vi forkaster ikke hypotesen. Det kan godt være, der er en smule tvivl om det nu kan passe, men tvivlen er ikke stærkt nok begrundet til at vi vil sige: det her med 7 % tror vi ikke på. 234
Stikordsregister a posteriori...223 a priori...223 Binomialfordelingen...225f. Binomialforsøg...226 boksplot...205 Boksplot...204 deskriptorer...201 Deskriptorer...200 deterministisk...220 Estimat...229 estimater...230 estimatoren...230 fejl...233 forkaste hypotesen...233 Fraktiler...212 frekvens...203 gennemsnit...200 Grupperede observationer...205 histogram...208 Histogram...207 hypotese...232 Hypotese...229 Hypoteser...232 hyppighed...203 Hyppighedstabel...202 intervalfrekvens...207f., 211 intervalhyppighed...207f. kontinuert...206 kumulerede...210f. kumulerede hyppighed...210 kvartilsæt...202 Kvartilsæt mv. for grupperede data...213 Kvartilsættet...203 median...200 Median...203 Middeltal...203 Middeltallet...214 Middeltallet for grupperede data...215 middelværdi...200 Nedre kvartil...203 235
236 observation...203 observationssæt...203 Observationssæt...201 Observationssættets størrelse...201, 203 population...206 populationens...229 Sandsynlighed...217 sekseren...217 Sigma...215 Statistikbanken...199 stikprøve...206 stikprøven...229 stokastisk...220 Stokastisk eksperiment...220 Stokastisk variabel...221 Sumkurven...211 summerede...210f. Summerede 5intervalhyppigheder...210 Summerede intervalhyppigheder...210 søjlediagram...207 Test...229, 233 teste hypotesen...233 typeinterval...208 typetal...200 Typetal...203 udfaldsrum...220 udfaldsrummet...222 variationsområdet...206 X~b(10; 0,3)...230 Øvre kvartil...203