KURSUSMATERIALE TIL DET NYE STATISTIKPENSUM
|
|
- Aksel Kjeldsen
- 8 år siden
- Visninger:
Transkript
1 KURSUSMATERIALE TIL DET NYE STATISTIKPENSUM Det foreliggende udkast til kursusmateriale er lagt ud til orientering for kollegerne med henblik på at indhente kommentarer til materialet. Sammen med Susanne Christensens elevnote (se forordet til kursusmaterialet) definerer kursusmaterialet det kommende obligatoriske pensum i χ 2 -test for niveauerne MatB og MatA, der forventes at træde i kraft for elever, der starter sommeren Eventuelle kommentarer sendes til fagkonsulent Bjørn Grøn: Bjorn.Gron@uvm.dk (redaktionen afsluttet )
2
3 Forord Lektor i statistik Susanne Christensen, Institut for Matematiske fag ved Aalborg Universitet har på min opfordring skrevet en note om χ 2 (chi-i-anden). Noten 1 dækker de emner, der påtænkes inddraget som kernestof i matematik stx på B- og på A-niveau, nemlig test for uafhængighed mellem to inddelingskriterier og test for fordeling af en given stikprøve (test for goodness of fit). Læreplansjusteringerne vil gælde for de elever, der starter i gymnasiet sommeren Noten er blevet læst og kommenteret af en baggrundsgruppe nedsat af fagkonsulenten: Aksel Bertelsen, Helge Gram Christensen, Steen Dilling, Bjørn Felsager, Olav Lyndrup og Jan Sørensen. Det er vores vurdering at noten kan danne grundlag for undervisning i emnet, og materialet stilles frit til rådighed til kopiering til ens elever. I tilknytning til denne note er der udarbejdet et supplerende materiale som bl.a. inddrager en eksperimentel tilgang til hypotesetest. I appendiks er demonstreret hvorledes dette kan gøres med brug af forskellige værktøjsprogrammer. Den eksperimentelle tilgang kan både indgå som en del af den mundtlige prøve og som en metode til besvarelsen af spørgsmål ved den skriftlige prøve. Fuldt pointtal i en besvarelse vil kunne opnås både med anvendelse af en eksperimentel tilgang og med anvendelse af indbyggede funktioner i et værktøjsprogram. Der er endelig lagt flere opgaver ind i dette materiale, lige som litteraturlisten er udbygget. Dette supplerende materiale kan enten anvendes direkte af den enkelte lærer eller danne grundlag for et skolebaseret kursus i emnet Bjørn Grøn, fagkonsulent 1 Noten findes på adressen: 1 (version )
4 Indholdsfortegnelse: Forord side 1 Indledning side 3 1. Statistisk test for uafhængighed mellem to inddelingskriterier (χ 2 test for uafhængighed) side 4 Om teststørrelsens fordeling under H 0 side 9 Opgaver side Hvad gør vi, hvis vi har flere niveauer på hvert af inddelingskriterierne? side 14 Om teststørrelsens fordeling under H 0 side 18 Opgaver side Statistisk test for fordeling af en stikprøve (χ 2 test for goodness of fit) side 24 Om teststørrelsens fordeling under H 0 side 26 Opgaver side 29 Større opgaver, der kan indgå i projekter sammen med biologi side 31 Litteraturliste side 34 Noter side 35 Appendiks 1: Eksperimentel tilgang til χ 2 -test med forskellige værktøjsprogrammer Appendiks 2: Standardværktøjer til udførelse af χ 2 -test med forskellige programmer 2 (version )
5 Indledning At træffe sine valg i en usikker verden den statistiske modellerings rolle. Et kursusmateriale baseret på en note af E. Susanne Christensen. Lektor i statistik. Institut for Matematiske Fag. Aalborg Universitet. I mange tilfælde og i mange forskellige faglige sammenhænge må man træffe en afgørelse eller basere en overbevisning på et ikke fuldstændigt informationsgrundlag. Det er fx tilfældet, når man ønsker at gætte på udfaldet af et kommende folketingsvalg og kun har en opinionsundersøgelse, eller når man ønsker at afgøre, om antallet af rygere er stigende blandt unge mennesker, men ikke har mulighed for at spørge alle unge, om de ryger eller ej. Ens afgørelse eller resultat kommer i sådanne tilfælde til at være præget af, hvilken stikprøve 1 man får fat i til sin undersøgelse. Et eksempel: Vi vil undersøge om holdningen til skattelettelser i Danmark er den samme for gymnasieelever som for gymnasielærere. For at være sikre på svaret skulle vi spørge hele populationen, dvs. samtlige gymnasieelever og gymnasielærere. Men en sådan strategi er normalt både praktisk og økonomisk umuligt. Så for at finde ud af det, må vi indsamle nogle data, som vi kan basere vores konklusioner på: Vi skal have en stikprøve! Hvis vi var så heldige at vide, at alle gymnasieelever i landet var enige med hinanden og alle gymnasielærere var indbyrdes enige i spørgsmålet om skattelettelser, så kunne vi hurtigt blive færdige. Vi skulle bare spørge én person fra hver gruppe, hvad de mente om sagen, og så afgøre om de to grupper også var enige. Og vi ville være helt sikre på, at vi havde draget den rigtige konklusion. Men så nemt går det sjældent. Der kan være ret stor forskel på meningerne indenfor gruppen. Og selvom det faktisk skulle forholde sig sådan at de fleste gymnasieelever går ind for skattelettelser, så kan vi jo godt være uheldige at udvælge de elever, der er imod og omvendt med lærerne til vores stikprøve. Hvis det er tilfældet, så vil vi ende op med den forkerte konklusion om gruppernes mening om spørgsmålet. Vi skal altså ikke bare have en stikprøve, men en stikprøve, der er udvalgt, så vi har en begrundet tro på, den er repræsentativ 2 for populationen. Det vi kan gøre for at mindske risikoen for at lave forkerte konklusioner er at tage fornuftige stikprøver, der er store nok til at risikoen for at komme til en forkert konklusion bliver acceptabel. Statistik går (blandt andet) ud på at præcisere alle de begreber, der her står i anførselstegn. Hvad sandsynligheden er, for at drage en forkert konklusion, kan beregnes. I hvert tilfælde hvis man følger nogle enkle regler, når man indsamler data. I denne note skal vi se på, hvordan man kan sætte tal på ens usikkerhed i et par specifikke tilfælde. 3 (version )
6 1. Statistisk test for uafhængighed mellem to inddelingskriterier (χ 2 test for uafhængighed) Hvis vi vil undersøge om det at bruge mange penge på tøj er lige udbredt blandt unge kvinder og unge mænd, er den mest objektive måde at forholde sig til problemstillingen, at lave en empirisk undersøgelse, dvs. ved at man indsamler data, og drager sine slutninger på baggrund af disse. Allerførst er der et par ting, der skal præciseres! Hvad er det for nogle unge, vi interesserer os for? I den statistiske terminologi hedder det at fastlægge populationen. Lad os sige, at det er unge mellem 15 og 20 år bosiddende i Danmark, vi er interesseret i. Så skal vi have præciseret, hvad vi egentligt forstår ved, at bruge mange penge på tøj. I den statistiske terminologi siger man, at vi skal have formuleret modellen og hypoteserne. Modellen kunne her være, at andelen af kvinder, der bruger mere end 1500 kr. om måneden på tøj er p k og den tilsvarende for mændene er p m. (Andelen p k er lig med sandsynligheden 3 for, at en kvinde tilfældigt udvalgt fra populationen bruger mere end 1500 kr. på tøj om måneden ). Grænsen for hvornår man bruger mange penge på tøj er jo her sat subjektivt, og kan selvfølgeligt gøres til genstand for diskussion 4. Vi kommer tilbage til hvilke matematiske krav, der skal stilles til denne grænse. Hypotesen er, at p m = p k, eller sagt i ord: Andelen af unge mænd der bruger mange penge på tøj er den samme som den tilsvarende andel for unge kvinder. For at undersøge vores hypotese kan vi fx gennemføre følgende eksperiment: Vi udvælger et antal unge mellem 15 og 20 år tilfældigt og spørger, hvor mange penge de bruger på tøj om måneden. Derefter tæller vi op, hvor mange kvinder, der bruger mere end 1500 kr, om måneden på tøj og tilsvarende for mænd. Vores resultat af undersøgelsen kan vi organisere i tabellen nedenfor (hvor tallene er fiktive - ikke resultat af en virkelig undersøgelse. Sådan en kan holdet selv lave!). Køn\Forbrug <1500 kr./måned 1500 kr./måned i alt kvinder mænd i alt (version )
7 1. Statistisk test for uafhængighed mellem to inddelingskriterier Vi kan nu gætte på andelen af unge kvinder, der bruger mange penge på tøj, simpelthen ved at regne ud, hvor stor andelen er i stikprøven. Vi siger, vi estimerer p k. I dette tilfælde får vi et estimat på 102/200= 0,51. Det vil sige, vi tror, at 51 % af de unge kvinder bruger mange penge på tøj 5. Tilsvarende estimerer vi andelen af mænd til 100/160=0,625. Vi tror altså, at der var 62,5 % af de unge mænd, der bruger mange penge på tøj. Når man skal undersøge et talmateriale som det ovenstående for at finde sammenhænge er det ofte en god ide at illustrere talmaterialet grafisk. I dette tilfælde kan man fx afbilde tabeldataene som stablede søjlediagrammer (her vist i Excel for andre programmer se appendiks). Af diagrammet fremgår, at i den stikprøve vi har, er andelen af kvinder, der bruger mange penge på tøj, mindre end den tilsvarende andel for mænd. Umiddelbart kan det altså se ud som om vores hypotese ikke holder stik, nemlig at der skulle være samme procentdeldel unge mænd som unge kvinder, der bruger mange penge på tøj. Resten af øvelsen går ud på at afgøre, om dette blot er en tilfældig følge af en uheldig stikprøve, ELLER om det vi har set, er så markant, at vi tør tage det som udtryk for en forskel mellem de to køn generelt, altså noget vi tror, der gælder for hele populationen. For at kunne regne på sagen og lave et statistisk test er det matematisk set vigtigt, at de enkelte svar på, hvor mange penge man bruger, er uafhængige 6 af hinanden. Hvis man fx i sin stikprøve har valgt en gruppe venner med stor indbyrdes påvirkning, så vil denne gruppe sagtens kunne have en adfærd, som er atypisk for populationen som helhed, og derved påvirke undersøgelsens resultat uhensigtsmæssigt. 7 5 (version )
8 1. Statistisk test for uafhængighed mellem to inddelingskriterier Statistisk hypotesetest minder logisk set om det, du måske kender fra din matematikundervisning som et modstridsargument. Man antager én ting - gennemfører en række logiske argumenter og ender op med noget, der klart er forkert. Heraf slutter man, at den oprindelige antagelse IKKE kan være rigtig. I statistik tager man hensyn til, at verden ikke er deterministisk, så her kan man ikke konkludere at udgangsantagelsen ikke er sand, men man kan eventuelt slutte, at det man har set i sit forsøg er USANDSYNLIGT, hvis udgangsantagelsen skulle være sand. Dermed peger forsøget på, at antagelsen ikke er rigtig. Vores antagelse om, at forbrugsmønsteret er ens for de to køn formuleres som vores udgangshypotese. Hvis vores test kan afvise den hypotese, så har vi et vist belæg for at påstå, at der er en signifikant 8 forskel mellem de to køn. Vi har således en udgangshypotese, som pr tradition kaldes H 0 (nulhypotesen) og en alternativ hypotese H 1 givet som: H 0 p k = p m H 1 p k p m En anden måde at udtrykke H 0 på er, at der er uafhængighed mellem det at bruge mange penge på tøj og ens køn. H 1 svarer så til, at der er afhængighed mellem de to inddelingskriterier - forbrug og køn, dvs. H 0 H 1 Der er uafhængighed mellem forbrug og køn. Der er afhængighed mellem forbrug og køn. Hypoteserne H 0 og H 1 kan illustreres med situationen ved en retssag. H 0 svarer til, at den anklagede er uskyldig, mens H 1 svarer til, at den anklagede er skyldig. Som i en retssag, lader vi tvivlen kommen den anklagede til gode, så med mindre vi har stærke beviser for, at den anklagede er skyldig, så vælger vi at acceptere H 0 (frikende den anklagede). Vi forkaster altså kun H 0, hvis vi har rigtigt gode beviser for, at H 0 er forkert. Vi starter med at antage, at H 0 udtrykker den sande tilstand af verden. I så fald kan vi estimere andelen af unge, der bruger mange penge uden hensyntagen til om de tilhører det ene eller det andet køn. Andelen af unge med et højt forbrug estimeres så til 202/360 0,5611, altså 56,11 %. Så ud af en gruppe på 200 unge, vil vi derfor forvente, at 200 0, ,22 af dem har et højt forbrug, og tilsvarende at 200 (1-0,5611) 87,78 af dem har et lavt forbrug. Her har vi brugt, at hvis sandsynligheden for at have et højt forbrug er givet ved p, så er sandsynligheden for det modsatte, nemlig at have et lavt forbrug, givet ved (1-p). Ud over at være logisk er dette også en regneregel fra den basale sandsynlighedsteori. Ved at regne på den måde, kan vi udfylde skemaet med de værdier, som vi ville have forventet at se, hvis verden opførte sig som vores H 0 foreskriver. Forventede værdier under antagelse af, at der er uafhængighed: Køn\Forbrug <1500 kr./måned 1500 kr./måned i alt kvinder = 87, = 112, mænd = 70, = 89, i alt (version )
9 1. Statistisk test for uafhængighed mellem to inddelingskriterier Afvigelserne mellem det resultat vi fik i forsøget og de her udregnede forventede værdier er et udtryk for, hvor langt forsøgets virkelighed er fra den verden, der er modelleret i H 0. For umiddelbart at kunne sammenligne de to tabeller med de observerede værdier og de forventede værdier samler vi dem i en enkelt tabel med observationer til venstre og forventede værdier til højre: Køn\Forbrug <1500 kr./måned 1500 kr./måned i alt kvinder ,78 112, mænd ,22 89, i alt Det er nu altid sådan, at summen af afvigelser er 0. I dette tilfælde fås således: (98-87,78) + ( ,22) + (60-70,22) + (100-89,78) = 0. Så at lægge afvigelserne sammen giver os ikke noget samlet billede af, hvor stor afvigelsen er. I stedet kan man udregne et mål for, hvor stor afvigelsen på følgende måde:først udregnes for hver celle kvadratet på differensen mellem det observerede antal og det forventede antal (hvorved vi kun får positive bidrag), og derefter divideres med det forventede antal. Dermed fås for den enkelte celle et relativt mål for afvigelsen. Til sidst summeres disse tal fra alle cellerne. Denne størrelse kaldes χ 2 -teststørrelsen. Som samlet formel ser det sådan ud 9 :. En stor værdi af teststørrelsen tyder i denne sammenhæng på, at udgangshypotesen om uafhængighed IKKE er opfyldt. Altså: store værdier af χ 2 -teststørrelsen får os til at tro mere på H1. Vi har så bare det problem tilbage, at vi skal afgøre, HVOR stor en teststørrelse skal være, før vi mener, den er så stor, at vi ikke vil tro på H 0. Til det brug skal vi vide, hvor store værdier test-størrelsen normalt vil antage, når H 0 er sand. Hvis hypotesen H 0 om uafhængighed er rigtig, og hvis man har en stor nok stikprøve (dvs. alle de forventede værdier er mindst 5) 10, så kan man i den matematiske statistik undersøge, hvilke værdier denne teststørrelse ville antage, hvis man lavede en uendelig række af forsøg som det skitserede. Det viser sig da at teststørrelsen med stor tilnærmelse har en opførsel, der ikke afhænger af hvor mange vi i alt har spurgt, dvs. i vores tilfælde 360 personer. Den statistiske terminologi er, at man kender teststørrelsens fordeling under H 0. Den vil nemlig med stor tilnærmelse følge det, der hedder en χ 2 -fordeling med 1 frihedsgrad (hvilket vi vil uddybe i et følgende afsnit). Hvis H 0 er rigtig, dvs. de to inddelingskriterier (her køn og forbrugsmønster) er uafhængige størrelser, så ville man i 5% af de gange, hvor man udvælger en stikprøve på 360 personer få en teststørrelse, der er større end 3,84. I 1% af tilfældene ville man tilsvarende få en teststørrelse, der er større end 6,63. 7 (version )
10 1. Statistisk test for uafhængighed mellem to inddelingskriterier Disse tal der også kaldes kritiske værdier hørende til signifikansniveauerne - kan findes i tabeller, på moderne lommeregnere, i Excel og i statistiske værktøjsprogrammer. (Man skal anvende den inverse χ 2 -fordeling til at finde de kritiske værdier hørende til et givet signifikansniveau). I Excel, hvor den inverse χ 2 -fordeling hedder chiinv(), ser det fx således ud (se appendiks for andre værktøjer): Teststørrelsen fra vores stikprøve bliver: 2 χ 2 (98 87,78) ( ,22) = + 87,78 112,22 = 1,19 + 0,93 + 1,49 + 1,16 = 4,77 2 (60 70,22) + 70,22 2 (100 89,78) + 89,78 2 Den er altså større end 3,84. Så HVIS antagelsen om uafhængighed mellem køn og forbrug skulle holde stik, så har vi her set et forsøg, der ville optræde med en sandsynlighed, der er mindre end 5%. Den statistiske terminologi er, at testsandsynligheden er mindre end 5 %. Dette kan naturligvis indtræffe, men når sandsynligheden er så lille, vælger vi at forkaste vores udgangshypotese og siger: Forsøget har påvist en sammenhæng mellem køn og forbrug på tøj, der er signifikant på 5% niveau. Men vores teststørrelse er IKKE større end de 6,63. Det betyder at forsøget ville optræde med en sandsynlighed, der er større end 1%. Vi siger, at testsandsynligheden er større end 1 %. Vi kan derfor ikke påvise en signifikant sammenhæng på 1% niveau. Hvis man, som det ofte er tilfældet, har en fast grænse for hvornår man vil vælge at forkaste sin udgangshypotese, fx når testsandsynligheden er mindre end 5 %, siger man, at man arbejder med et signifikansniveau 11 på 5%. Ved at bruge et fast signifikansniveau på fx 5% i en hel række af forsøg og test ved man altså, at man i 5% af testene fejlagtigt vil forkaste en sand udgangshypotese 12. Vi ved, hvor sikker metoden er, men vi ved ikke, om den enkelte beslutning om at tro på udgangshypotesen er rigtig eller ej. Ved at fastlægge et lavere signifikansniveau, fx på 1%, kræver vi en betydelig større forskel på de to køns forbrug af tøj, før vi siger, der er signifikant forskel. Til gengæld er det nu kun i 1% af tilfældene, at vi forkaster en sand hypotese. På en lommeregner, i et regneark eller et statistisk værktøjsprogram kan man få den præcise sandsynlighed for at få en χ 2 -teststørrelse, der er større end de observerede 4,77, under antagelse af at H 0 er sand. Det sker ved at slå værdien 4,77 op i en χ 2 fordeling med 1 frihedsgrad. (Man skal anvende den kumulerede χ 2 -fordeling til at finde testsandsynligheder eller p-værdier). I Excel ser det fx således ud: 8 (version )
11 1. Statistisk test for uafhængighed mellem to inddelingskriterier Denne sandsynlighed kaldes p-værdien eller testsandsynligheden for testet. En p-værdi er altså sandsynligheden for at få en teststørrelse, der får os til at tvivle mindst lige så meget på H 0, som den teststørrelse vi lige har observeret, under antagelse af at H 0 faktisk er den rigtig hypotese. I det aktuelle eksempel får vi således en p-værdi på p = = 2.89% jfr. celle B2. Da p-værdien er lille, dvs. under 5%, er forskellen signifikant på signifikansniveauet 5%. Men den er stadigvæk større end 1%, dvs. forskellen er ikke signifikant på signifikansniveauet 1%. Vi kan altså nå til de samme konklusioner som før uden at udregne størrelsen af de kritiske teststørrelser hørende til signifikansniveauerne. Om teststørrelsens fordeling under H 0. I det ovenstående eksempel har vi spurgt 360 unge om deres køn og deres tøjforbrug. Hvis vi først ser på køn og forbrug hver for sig fordeler de sig således: I undersøgelsen deltog 200 kvinder og 160 mænd. Tilsvarende fandt vi at 158 unge havde et lavt tøjforbrug, mens 202 havde et stort tøjforbrug. Det svarer til randværdierne i krydstabellen: Køn\Forbrug <1500 kr./måned 1500 kr./måned i alt kvinder 200 mænd 160 i alt Men det der interesserer os er i virkeligheden koblingen mellem køn og forbrug, dvs. hvor mange kvinder har et lavt tøjforbrug osv. Det svarer til tallene i cellerne inde i krydstabellen. Disse tal afhænger nu af hinanden på den følgende måde: Summen af alle tallene for cellerne i første søjle (unge med lavt forbrug) skal give 158. Summen af alle tallene i første række (unge kvinder) skal give 200 osv. Da et antal ikke kan være negativt følger det nu at antallet af kvinder med et lavt tøjforbrug i princippet kan antage alle værdier fra 0 til 158. Så snart vi har fastlagt antallet af kvinder med lavt tøjforbrug følger resten af cellerne imidlertid automatisk, idet summen af tallene i første søjle skal give 158, summen af tallene i første række skal give 200 osv. 13 Hvis vi fx ser på en mulig krydstabel med 100 kvinder, der har et lavt tøjforbrug, følger det derfor at den må have følgende opbygning: Køn\Forbrug <1500 kr./måned 1500 kr./måned i alt kvinder mænd i alt (version )
12 1. Statistisk test for uafhængighed mellem to inddelingskriterier Da vi kun kan vælge en af cellerne frit (indenfor visse bånd) siger vi, at krydstabellen har netop én frihedsgrad. Til hver af de mulige krydstabeller kan vi nu knytte en χ 2 -teststørrelse som beskrevet ovenfor. I det ovenstående eksempel fås fx (100 87,78) ( ,22) (58 70,22) (102 89,78) χ = ,78 112,22 70,22 89,78 = 1,70 + 1,33 + 2,13 + 1,66 = 6,82 I χ 2 -testet antager vi nu at køn og forbrug er uafhængige, og dermed at krydstabeller, der ligger tæt på de forventede værdier (og dermed har en lille teststørrelse) har høj sandsynlighed, mens krydstabeller, der ligger langt fra de forventede værdier (og dermed har en stor teststørrelse) har lav sandsynlighed. En præcis beregning af sandsynlighederne viser sig dog at være særdeles vanskelig. Til gengæld er en simpel tilnærmet beregning af sandsynlighederne overraskende nok mulig. I den matematiske statistik viser man nemlig at sandsynligheden for en given krydstabel med stor tilnærmelse er knyttet til χ 2 -fordelingen med 1 frihedsgrad. Det skal forstås sådan at sandsynligheden for at finde en teststørrelse, der er mindst lige så stor som den observerede med stor tilnærmelse er givet ved arealet under den graf, der er knyttet til χ 2 - fordelingen med 1 frihedsgrad 14 : Som omtalt i teksten kunne vi i princippet også finde sandsynligheden ved at gentage spørgeskemaundersøgelsen uendeligt mange gange. I praksis er vi selvfølgelig nødt til at stoppe efter et stort antal gange. Her ses resultatet af 1000 gentagne simuleringer af udregningen af teststørrelsen under antagelsen af H 0, og med fastholdte marginaler (jfr. note 13), hvor hver prik svarer til teststørrelsen for den fundne krydstabel: 10 (version )
13 1. Statistisk test for uafhængighed mellem to inddelingskriterier I dette tilfælde fandt vi altså 27 krydstabeller med en teststørrelse, der er mindst lige så stor som den observerede. Det svarer til en p-værdi på 27/1000 = 2,7%, hvilket ligger rimeligt tæt på den teoretiske p-værdi 2,9%. Vi kan også afbilde fordelingen af teststørrelserne i et histogram og derved sammenligne direkte med den teoretiske χ 2 -fordeling med 1 frihedsgrad (idet histogrammet først er justeret, så det samlede areal er 1): I appendiks kan man læse mere om en eksperimentel tilgang til χ 2 -testet og den tilhørende fordeling af teststørrelsen. 11 (version )
14 1. Statistisk test for uafhængighed mellem to inddelingskriterier Opgaver til uafhængighedstest (2 2-tabeller) Opgave 1. I dagens politik spiller skattenedsættelser en stor rolle. Et stort antal lønarbejdere udspørges via et telefoninterview om deres holdning til en lønnedgang, der kompenseres med en skattenedsættelse: Vil du acceptere en lønnedsættelse, hvis den kompenseres med en skattenedsættelse, således at reallønnen (købekraften) er uændret? Svarene fordeler sig således på køn: Køn\Holdning Ja Nej Kvinder Mænd Fremstil tabellen grafisk i et passende søjlediagram. Kommenter hvad du ser, med brug af begrebet stikprøve. Færdigudfyld den følgende tabel: Køn\Holdning Ja Nej I alt Kvinder Mænd I alt Udregn de forventede antal: Køn\Holdning Ja Nej I alt Kvinder Mænd I alt Udregn χ 2 -teststørrelsen og find p-værdien. Er forskellen mellem de observerede og forventede svar signifikant på 5% niveau? På 1% niveau? Opgave 2: I en Gallupundersøgelse blev 234 kvinder og 257 mænd spurgt om de var tilfredse med deres udseende, i den forstand at de anså sig selv som fysisk tiltrækkende for det modsatte køn. Hertil svarede (i afrundede procenttal) 71% af kvinderne, at de var tilfredse med deres udseende, mens 81% af mændene svarede, at de var tilfredse med deres udseende. 12 (version )
15 1. Statistisk test for uafhængighed mellem to inddelingskriterier Færdigudfyld det følgende skema Køn\Selvopfattelse Tilfreds Utilfreds I alt Kvinder 234 Mænd 257 I alt Fremstil tabellen grafisk i et passende søjlediagram. Kommenter hvad du ser, med brug af begrebet stikprøve. Hvor stor en andel af samtlige adspurgte er tilfredse? Utilfredse? Udregn χ 2 -teststørrelsen og p-værdien. Er forskellen mellem de observerede og forventede svar signifikant på 5% niveau? På 1% niveau? Opgave 3: Det er en velkendt opfattelse at psykologiske og sociale forhold har indflydelse på overlevelseschancen efter en alvorlig sygdom. En undersøgelse fra 1980 handlede om en eventuel sammenhæng mellem kæledyr og chancen for at overleve i mindst et år efter en hjerteoperation. I undersøgelsen, der omfattede 53 patienter med kæledyr og 39 patienter uden kæledyr, var 78 af patienterne i live efter et år. Af de 78 patienter, der overlevede havde de 50 kæledyr. Er der belæg i undersøgelsen for en statistisk sammenhæng mellem at overleve i mindst et år og at have kæledyr? Opgave 4: I en berømt klagesag fra 1973 blev University of California i Berkeley i USA beskyldt for kønsdiskrimination i sine optagelsesprocedurer. Dette er en meget alvorlig anklage i USA, da en række af offentlige tilskud er afhængige af at Universitet opfylder en række kriterier for god opførsel, herunder at Universitet ikke diskriminerer mod køn, race, religion osv. i sine optagelsesprocedurer. Ud af 2691 mandlige ansøgere blev de 1198 optaget. Ud af 1835 kvindelige ansøgere blev 557 optaget. Opstil en krydstabel for koblingen mellem køn og optagelse på University of California i Berkeley. Undersøg om der er belæg i krydstabellen for at anklage universitet for kønsdiskrimination, idet du inddrager begreber som udgangshypotesen H 0, antallet af frihedsgrader, χ 2 - teststørrelsen, p-værdien og signifikansniveauet. Opgave 5 (ikke pensum til skriftlig eksamen): I en undersøgelse af danske mænds og kvinders tv forbrug svarer 60% af kvinderne i stikprøven, at de ser mere end 20 timer tv om ugen, mens det tilsvarende tal for mændene er 53%. Stikprøven indeholder lige mange personer af hver køn, og hypotesen lige mange mænd og kvinder ser mere end 20 timer tv om ugen forkastes på 5% signifikansniveau, men accepteres på 1% signifikansniveau. Bestem en mulig størrelse af stikprøven. 13 (version )
16 2. Hvad gør vi, hvis vi har flere niveauer på hvert af inddelingskriterierne? Ofte er der flere end to kriterier, hvorefter vi inddeler. Betragt følgende eksempel: En hjerneforsker forsker i forskellige måder at operere for en bestemt type hjernetumor. Der er tre forskellige operationstyper: Type A, hvor man kun fjerner selve tumoren; Type B, hvor man også tager lidt af det nærmeste omkringliggende væv bort, og Type C, hvor der fjernes en større del af det omkringliggende væv. Lægen ønsker at vide, hvordan operationstypen indvirker på chancen for at overleve et halvt år efter operationen. Over en årrække har lægen indsamlet følgende data over resultaterne af operationerne (data er fiktive, problemstillingen er autentisk): Operation\Status i live død i alt Operation A Operation B Operation C i alt Afbildes tabellen grafisk som stablede søjlediagrammer fås: Sammenhæng mellem operation og status 100% 90% 80% Relativ hyppighed 70% 60% 50% 40% 30% 20% 10% Død I live 0% A B C Operation I stikprøven er der altså forskel på andelen af overlevende efter de forskellige typer af operation. Vi skal forsøge at undersøge, om det er en så stor forskel, at man kan sige, resultaterne kan generaliseres ud over denne stikprøve, altså: er det statistisk signifikant? Vi skal altså forsøge at regne ud, om den sete stikprøve er meget ekstrem, hvis vi antager, at der ikke er forskel på overlevelseschancerne efter de forskellige operationer. Vi lader p A være sandsynligheden for at en patient er i live et halv år efter at have gennemgået en operation af type A, og tilsvarende for p B og p C. Udgangshypotesen er, at der er samme sandsynlighed for overlevelse efter alle tre typer operation, dvs. 14 (version )
17 2. Hvad gør vi, hvis vi har flere niveauer på hvert af inddelingskriterierne? H 0 H 1 p A = p B = p C Ikke alle tre sandsynligheder ens. Hvis udgangshypotesen holder, estimerer vi sandsynligheden for overlevelse ved 59 = 0,6211, og vi kan udregne de forventede værdier efter samme princip som før: 95 Forventede Værdier i live Død i alt Operation A 0, = 33, 54 ( 1 0,6211) 54 = 20, Operation B 0, = 9, 94 ( 1 0,6211) 16 = 6, Operation C 0, = 15, 53 ( 1 0,6211) 25 = 9, i alt Alle de forventede størrelser er mindst 5, så vi kan bruge χ 2 -testet igen, nu bare med nogle lidt andre tal. Teststørrelsen udregnes som før ved at udregne:, hvor der summeres over alle celler. Dvs. vi får her: 40 33,54 33, , ,94 6 6, , ,47 10,53 20,46 9,94 6,06 15,53 9,47 Når vi skal vurdere teststørrelsen kan vi som før anvende lommeregner, regneark eller et statistisk værktøjsprogram. I dette tilfælde skal vi benytte en χ 2 -fordeling med 2 frihedsgrader (for en nærmere uddybning af antallet af frihedsgrader se evt. det følgende afsnit). Det giver os mulighed for at udregne såvel de kritiske teststørrelser som p-værdien: Ved opslag får vi denne gang, at hvis dette forsøg blev gentaget et meget stort antal gange ( uendeligt mange gange ) ville vi i 5% af tilfældene få en teststørrelse, der er større end 5,99 og i 1% af tilfældene få en teststørrelse større end 9,21, alt sammen under antagelse af at udgangshypotesen H 0 om uafhængigheden af operationstypen og patientens status er sand. Som før kan vi også bestemme en p-værdi for teststørrelsen 10,53, dvs. bestemme den præcise sandsynlighed for at få en teststørrelse på 10,53 eller derover; igen selvfølgelig under forudsætning af, at H 0 er sand. I fx Excel finder vi da en p-værdi på 0,0052 = 0,52%: 15 (version )
18 2. Hvad gør vi, hvis vi har flere niveauer på hvert af inddelingskriterierne? Så i dette tilfælde er vores valgmuligheder: ENTEN fastholder vi troen på, at de tre operationstyper giver samme overlevelseschance OG vi har set et forsøg, der har mindre end 1 % sandsynlighed for at indtræffe ELLER vi forkaster hypotesen om lige store chancer for overlevelse og siger: Der er fundet en sammenhæng mellem overlevelseschance og operationstype, der er statistisk signifikant på 1% niveau. Ved at udregne de enkelte bidrag til teststørrelsen kan man tydeliggøre, hvilke celler der giver de store bidrag til teststørrelsen, når man må forkaste nulhypotesen. Man ser tydeligt at det først og fremmest er bidragene fra operation C, der er problematiske. Observation: Operation\Status i live død i alt Operation A Operation B Operation C i alt Forventet: Operation\Status i live død i alt Operation A 33, , Operation B 9, , Operation C 15, , i alt Bidrag til chi2: Operation\Status i live død Operation A 1, , Operation B 0, , Operation C 2, , Har vi ikke yderligere viden, må vi derfor foreslå, at operationstype C stilles i bero. Imidlertid skal man tænke sig om, inden man foreslår operationstype C forbudt. Hvis der er en tredje faktor der influerer billedet, så kan det give misvisende konklusioner, når man kun tager to af faktorerne i betragtning. Vi kigger lidt nærmere på tallene fra før: 16 (version )
At træffe sine valg i en usikker verden - eller den statistiske modellerings rolle.
At træffe sine valg i en usikker verden - eller den statistiske modellerings rolle. Af E. Susanne Christensen. Lektor i statistik. Institut for Matematiske Fag. Aalborg Universitet. I mange tilfælde og
Læs mereWorkshop i hypotesetest
Workshop i hypotesetest Indholdsfortegnelse: Velkommen til TI-Nspire CAS version 3.2 Simple øvelser i chi2-test: Chi2-test I: Goodness-of-fit test side 1 Chi2-test II: Uafhængighedstest side 3 Vejledende
Læs mereMATEMATIK A-NIVEAU. Anders Jørgensen & Mark Kddafi. Vejledende eksempler på eksamensopgaver og eksamensopgaver i matematik, 2012
MATEMATIK A-NIVEAU Vejledende eksempler på eksamensopgaver og eksamensopgaver i matematik, 2012 Kapitel 4 Statistik & sandsynlighedsregning 2016 MATEMATIK A-NIVEAU Vejledende eksempler på eksamensopgaver
Læs merePersonlig stemmeafgivning
Ib Michelsen X 2 -test 1 Personlig stemmeafgivning Efter valget i 2005 1 har man udspurgt en mindre del af de deltagende, om de har stemt personligt. Man har svar fra 1131 mænd (hvoraf 54 % har stemt personligt
Læs mereVejledende eksamensopgaver vedr. hypotesetest (stx B og stx A)
Vejledende eksamensopgaver vedr. hypotesetest (stx B og stx A) Opgave 1 I nedenstående tabel ses resultaterne af samtlige hjerteklapoperationer i 007-08 ved Odense Universitetshospital (OUH) sammenlignet
Læs mereVærktøjshjælp for TI-Nspire CAS Struktur for appendiks:
Værktøjshjælp for TI-Nspire CAS Struktur for appendiks: Til hvert af de gennemgåede værktøjer findes der 5 afsnit. De enkelte afsnit kan læses uafhængigt af hinanden. Der forudsættes et elementært kendskab
Læs mereCMU PROJEKT HYPOTESETEST OG SIMULERING MICHAEL AGERMOSE JENSEN CHRISTIANSHAVNS GYMNASIUM
CMU PROJEKT HYPOTESETEST OG SIMULERING MICHAEL AGERMOSE JENSEN CHRISTIANSHAVNS GYMNASIUM FORMÅL - BEKENDTGØRELSEN STX MATEMATIK A Kompetencer anvende simple statistiske eller sandsynlighedsteoretiske modeller
Læs mereHypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0
Hypotesetest Hypotesetest generelt Ingredienserne i en hypotesetest: Statistisk model, f.eks. X 1,,X n uafhængige fra bestemt fordeling. Parameter med estimat. Nulhypotese, f.eks. at antager en bestemt
Læs mereLars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ 2 -test og Goodness of Fit test.
Lars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ -test og Goodness of Fit test. Anvendelser af statistik Statistik er et levende og fascinerende emne, men at læse om det er alt
Læs mereStatistik II 1. Lektion. Analyse af kontingenstabeller
Statistik II 1. Lektion Analyse af kontingenstabeller Kursusbeskrivelse Omfang 5 kursusgange (forelæsning + opgaveregning) 5 kursusgange (mini-projekt) Emner Analyse af kontingenstabeller Logistisk regression
Læs mereMaple 11 - Chi-i-anden test
Maple 11 - Chi-i-anden test Erik Vestergaard 2014 Indledning I dette dokument skal vi se hvordan Maple kan bruges til at løse opgaver indenfor χ 2 tests: χ 2 - Goodness of fit test samt χ 2 -uafhængighedstest.
Læs merec) For, er, hvorefter. Forklar.
1 af 13 MATEMATIK B hhx Udskriv siden FACITLISTE TIL KAPITEL 7 ØVELSER ØVELSE 1 c) ØVELSE 2 og. Forklar. c) For, er, hvorefter. Forklar. ØVELSE 3 c) ØVELSE 4 90 % konfidensinterval: 99 % konfidensinterval:
Læs merefor gymnasiet og hf 2016 Karsten Juul
for gymnasiet og hf 75 50 5 016 Karsten Juul Statistik for gymnasiet og hf Ä 016 Karsten Juul 4/1-016 Nyeste version af dette håfte kan downloades fra http://mat1.dk/noter.htm HÅftet mç benyttes i undervisningen
Læs mereLøs nu opgaverne i a) brug alt materialet her samt evt. regnearkene i Fronter som hjælp.
Udarbejdet af Thomas Jensen og Morten Overgård Nielsen Indhold Introduktion til materialet. s. 2 Introduktion til chi i anden test. s. 4 Et eksempel hastighed og ulykker på motorveje s. 8 Sådan udregnes
Læs mereFig. 1 Billede af de 60 terninger på mit skrivebord
Simulation af χ 2 - fordeling John Andersen Introduktion En dag kastede jeg 60 terninger Fig. 1 Billede af de 60 terninger på mit skrivebord For at danne mig et billede af hyppighederne flyttede jeg rundt
Læs mere2 -test. Fordelingen er særdeles kompleks at beskrive med matematiske formler. 2 -test blev opfundet af Pearson omkring år 1900.
2 -fordeling og 2 -test Generelt om 2 -fordelingen 2 -fordelingen er en kontinuert fordeling, modsat binomialfordelingen som er en diskret fordeling. Fordelingen er særdeles kompleks at beskrive med matematiske
Læs mereJ E T T E V E S T E R G A A R D
BINOMIALT EST J E T T E V E S T E R G A A R D F I P B I O L O G I M A R S E L I S B O R G G Y M N A S I U M D. 1 3. M A R T S 2 0 1 9 K A L U N D B O R G G Y M N A S I U M D. 1 4. M A R T S 2 0 1 9 HVEM
Læs mereχ 2 -test i GeoGebra Jens Sveistrup, Gammel Hellerup Gymnasium
χ 2 -test i GeoGebra Jens Sveistrup, Gammel Hellerup Gymnasium Man kan nemt lave χ 2 -test i GeoGebra både goodness-of-fit-test og uafhængighedstest. Den følgende vejledning bygger på GeoGebra version
Læs mereProjekt 9.5 Racefordomme i USA og Simpsons paradoks (B og A)
Projekt 9.5 Racefordomme i USA og Simpsons paradoks (B og A) (Data er hentet fra M. Radelet, "Racial characteristics and imposition of death penalty", American Sociological Review, 46 (1981), pp 918-927
Læs merefor gymnasiet og hf 2017 Karsten Juul
for gymnasiet og hf 75 50 5 017 Karsten Juul Statistik for gymnasiet og hf 017 Karsten Juul 5/11-017 Nyeste version af dette hæfte kan downloades fra http://mat1.dk/noter.htm Hæftet må benyttes i undervisningen
Læs mereHvad er meningen? Et forløb om opinionsundersøgelser
Hvad er meningen? Et forløb om opinionsundersøgelser Jette Rygaard Poulsen, Frederikshavn Gymnasium og HF-kursus Hans Vestergaard, Frederikshavn Gymnasium og HF-kursus Søren Lundbye-Christensen, AAU 17-10-2004
Læs mereSimulering af stokastiske fænomener med Excel
Simulering af stokastiske fænomener med Excel John Andersen, Læreruddannelsen i Aarhus, VIA Det kan være en ret krævende læreproces at udvikle fornemmelse for mange begreber fra sandsynlighedsregningen
Læs mereMatematik A. Studentereksamen. Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet
Matematik A Studentereksamen Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet stx11-matn/a-080501 Tirsdag den 8. maj 01 Forberedelsesmateriale til stx A Net MATEMATIK Der
Læs mereStatistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Uafhængighedstestet
Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Uafhængighedstestet Eksempel: Bissau data Data kommer fra Guinea-Bissau i Vestafrika: 5273 børn blev undersøgt da de var yngre end 7 mdr og blev
Læs mereAnvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]
Anvendt Statistik Lektion 6 Kontingenstabeller χ 2- test [ki-i-anden-test] Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination af
Læs merefor matematik pä B-niveau i hf
for matematik pä B-niveau i hf 75 50 5 016 Karsten Juul GRUPPEREDE DATA 1.1 Hvad er deskriptiv statistik?...1 1. Hvad er grupperede og ugrupperede data?...1 1.1 Eksempel pä ugrupperede data...1 1. Eksempel
Læs mereSchweynoch, 2003. Se eventuelt http://www.mathematik.uni-kassel.de/~fathom/projekt.htm.
Projekt 8.5 Hypotesetest med anvendelse af t-test (Dette materiale har været anvendt som forberedelsesmateriale til den skriftlige prøve 01 for netforsøget) Indhold Indledning... 1 χ -test... Numeriske
Læs mere3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.
PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve
Læs mereAnvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele
Anvendt Statistik Lektion 4 Hypotesetest generelt Test for middelværdi Test for andele Hypoteser og Test Hypotese I statistik er en hypotese en påstand om en populationsparameter. Typisk en påstand om
Læs mereVelkommen til Flemmings store Maplekursus 1. lektion. Skift mellem tekst- og matematikmode
Velkommen til Flemmings store Maplekursus 1. lektion. Skift mellem tekst- og matematikmode Man kan skifte mellem tekst- og matemamatikmode ved at trykke på F5. I øjeblikket er jeg i tekstmode.. 2. lektion.
Læs mereStatistik viden eller tilfældighed
MATEMATIK i perspektiv Side 1 af 9 DNA-analyser 1 Sandsynligheden for at en uskyldig anklages Følgende histogram viser, hvordan fragmentlængden for et DNA-område varierer inden for befolkningen. Der indgår
Læs mereAnvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]
Anvendt Statistik Lektion 6 Kontingenstabeller χ 2 -test [ki-i-anden-test] 1 Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination
Læs mereBetinget fordeling Uafhængighed. Beregning af forventet tabel Chi-kvadrat teststatistik Chi-kvadrat test. Chi-kvadratfordelingen Agresti - Summary
1 Kontingenstabeller Betinget fordeling Uafhængighed 2 Chi-kvadrat test for uafhængighed Beregning af forventet tabel Chi-kvadrat teststatistik Chi-kvadrat test. Chi-kvadratfordelingen Agresti - Summary
Læs merefor matematik pä B-niveau i hf
for matematik pä B-niveau i hf 014 Karsten Juul TEST 1 StikprÅver... 1 1.1 Hvad er populationen?... 1 1. Hvad er stikpråven?... 1 1.3 Systematiske fejl ved valg af stikpråven.... 1 1.4 TilfÇldige fejl
Læs mereKonfidensintervaller og Hypotesetest
Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele Repetition fra sidst: Konfidensintervaller
Læs mereHypotesetests, fejltyper og p-værdier
Hypotesetests, fejltyper og p-værdier Søren Højsgaard Institut for Matematiske Fag, Aalborg Universitet October 25, 2018 Søren Højsgaard Institut for Matematiske Fag, Aalborg Hypotesetests, Universitet
Læs mereSimulering af stokastiske fænomener med Excel
Simulering af stokastiske fænomener med Excel John Andersen, Læreruddannelsen i Aarhus, VIA Det kan være en ret krævende læreproces at udvikle fornemmelse for mange begreber fra sandsynlighedsregningen
Læs mereKapitel 8 Chi-i-anden (χ 2 ) prøven
Kapitel 8 Chi-i-anden (χ 2 ) prøven Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 / 19 Indledning Forskelle mellem stikprøver undersøges med z-test eller t-test for data målt på
Læs mereFlemmings Maplekursus 1. Løsning af ligninger
Flemmings Maplekursus 1. Løsning af ligninger a) Ligninger med variabel og kun en løsning. Ligningen løses 10 3 Hvis vi ønsker løsningen udtrykt som en decimalbrøk i stedet: 3.333333333 Løsningen 3 er
Læs mereMikro-kursus i statistik 1. del. 24-11-2002 Mikrokursus i biostatistik 1
Mikro-kursus i statistik 1. del 24-11-2002 Mikrokursus i biostatistik 1 Hvad er statistik? Det systematiske studium af tilfældighedernes spil!dyrkes af biostatistikere Anvendes som redskab til vurdering
Læs mereMatematik og samfundsfag Gini-koefficienten
Erik Vestergaard www.matematikfysik.dk Matematik og samfundsfag Gini-koefficienten Den såkaldte Gini-koefficient, introduceret i 92 i en artikel af den italienske statistiker, demograf og sociolog Corrado
Læs mereI. Deskriptiv analyse af kroppens proportioner
Projektet er delt i to, og man kan vælge kun at gennemføre den ene del. Man kan vælge selv at frembringe data, fx gennem et samarbejde med idræt eller biologi, eller man kan anvende de foreliggende data,
Læs mereForelæsning 9: Inferens for andele (kapitel 10)
Kursus 02402 Introduktion til Statistik Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800
Læs mereStatistik. Statistik er analyse af indsamlet data. Det vil sige at man bearbejder et datamateriale som i matematik næsten altid er tal.
Statistik Statistik er analyse af indsamlet data. Det vil sige at man bearbejder et datamateriale som i matematik næsten altid er tal. Derved får man et samlet overblik over talmaterialet, og man kan konkludere
Læs mereSpørgeskemaundersøgelser og databehandling
DASG. Nye veje i statistik og sandsynlighedsregning. side 1 af 12 Spørgeskemaundersøgelser og databehandling Disse noter er udarbejdet i forbindelse med et tværfagligt samarbejde mellem matematik og samfundsfag
Læs mereProjekt 2.9 Sumkurver som funktionsudtryk anvendt til Lorenzkurver og Ginikoefficienter (især for B- og A-niveau)
Projekt 2.9 Sumkurver som funktionsudtryk anvendt til Lorenzkurver og Ginikoefficienter En sumkurve fremkommer ifølge definitionen, ved at vi forbinder en række punkter afsat i et koordinatsystem med rette
Læs mereSkriftlig eksamen i samfundsfag
OpenSamf Skriftlig eksamen i samfundsfag Indholdsfortegnelse 1. Introduktion 2. Præcise nedslag 3. Beregninger 3.1. Hvad kan absolutte tal være? 3.2. Procentvis ændring (vækst) 3.2.1 Tolkning af egne beregninger
Læs mereKursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo
Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte
Læs mereStatistik i basketball
En note til opgaveskrivning jerome@falconbasket.dk 4. marts 200 Indledning I Falcon og andre klubber er der en del gymnasieelever, der på et tidspunkt i løbet af deres gymnasietid skal skrive en større
Læs mereTemaopgave i statistik for
Temaopgave i statistik for matematik B og A Indhold Opgave 1. Kast med 12 terninger 20 gange i praksis... 3 Opgave 2. Kast med 12 terninger teoretisk... 4 Opgave 3. Kast med 12 terninger 20 gange simulering...
Læs mereDeskriptiv statistik for hf-matc
Deskriptiv statistik for hf-matc 75 50 25 2018 Karsten Juul Deskriptiv statistik for hf-matc Hvad er deskriptiv statistik? 1.1 Hvad er deskriptiv statistik?... 1 1.2 Hvad er grupperede og ugrupperede data?...
Læs mere1 Problemformulering CYKELHJELM
1 Problemformulering I skal undersøge hvor mange cyklister, der kommer til skade og hvor alvorlige, deres skader er. I skal finde ud af, om cykelhjelm gør nogen forskel, hvis man kommer ud for en ulykke.
Læs mereRettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007
Rettevejledning til eksamen i Kvantitative metoder 1,. årsprøve. januar 007 I rettevejledningen henvises der til Berry and Lindgren "Statistics Theory and methods"(b&l) hvis ikke andet er nævnt. Opgave
Læs mereStatistik med TI-Nspire CAS version 3.2. Bjørn Felsager September 2012. [Fjerde udgave]
Statistik med TI-Nspire CAS version 3.2 Bjørn Felsager September 2012 [Fjerde udgave] Indholdsfortegnelse Forord Beskrivende statistik 1 Grundlæggende TI-Nspire CAS-teknikker... 4 1.2 Lister og regneark...
Læs mereLøsning til eksaminen d. 14. december 2009
DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,
Læs mereDeskriptiv statistik for matc i stx og hf
Deskriptiv statistik for matc i stx og hf 75 50 25 2019 Karsten Juul Deskriptiv statistik for matc i stx og hf Hvad er deskriptiv statistik? 1.1 Hvad er deskriptiv statistik?... 1 1.2 Hvad er grupperede
Læs mere(Projektets første del er rent deskriptiv, mens anden del peger frem mod hypotesetest. Projektet kan gemmes til dette emne, eller tages op igen der)
Projekt 2.4 Menneskets proportioner (Projektets første del er rent deskriptiv, mens anden del peger frem mod hypotesetest. Projektet kan gemmes til dette emne, eller tages op igen der) I. Deskriptiv analyse
Læs mereStatistik II 1. Lektion. Sandsynlighedsregning Analyse af kontingenstabeller
Statistik II 1. Lektion Sandsynlighedsregning Analyse af kontingenstabeller Kursusbeskrivelse Omfang 5 kursusgange (forelæsning + opgaveregning) 5 kursusgange (mini-projekt) Emner Analyse af kontingenstabeller
Læs mereVejledende besvarelser til opgaver i kapitel 14
Vejledende besvarelser til opgaver i kapitel 14 Opgave 1 a) Det første trin i opstillingen af en hypotesetest er at formulere to hypoteser, hvoraf den ene støtter den teori vi vil teste, mens den anden
Læs mereSkolevægring. Resultater fra en spørgeskemaundersøgelse blandt skoleledere på danske folkeskoler og specialskoler
Skolevægring Resultater fra en spørgeskemaundersøgelse blandt skoleledere på danske folkeskoler og specialskoler Udarbejdet af Analyse & Tal for Institut for Menneskerettigheder juli 017 Indledning Udsendelse
Læs mereFagligt samspil mellem Ma-B og SA-A Lisbeth Basballe, Mariagerfjord Gymnasium og Marianne Kesselhahn, Egedal Gymnasium og HF
Fagligt samspil mellem Ma-B og SA-A Lisbeth Basballe, Mariagerfjord Gymnasium og Marianne Kesselhahn, Egedal Gymnasium og HF Vi ønskede at planlægge og afprøve et undervisningsforløb, hvor anvendelse af
Læs mereSupplement til kapitel 7: Approksimationen til normalfordelingen, s. 136
Supplement til kapitel 7: Approksimationen til normalfordelingen, s. 36 Det er besværligt at regne med binomialfordelingen, og man vælger derfor ofte at bruge en approksimation med normalfordeling. Man
Læs mereStatistik. Peter Sørensen: Statistik og sandsynlighed Side 1
Statistik Formålet... 1 Mindsteværdi... 1 Størsteværdi... 1 Ikke grupperede observationer... 2 Median og kvartiler defineres ved ikke grupperede observationer således:... 2 Middeltal defineres ved ikke
Læs merestatistik og sandsynlighed
brikkerne til regning & matematik statistik og sandsynlighed trin 1 preben bernitt brikkerne statistik og sandsynlighed 1 1. udgave som E-bog ISBN: 978-87-92488-19-0 2004 by bernitt-matematik.dk Kopiering
Læs mereStatistiske modeller
Statistiske modeller Statistisk model Datamatrice Variabelmatrice Hændelse Sandsynligheder Data Statistiske modeller indeholder: Variable Hændelser defineret ved mulige variabel værdier Sandsynligheder
Læs mereKapitlet indledes med en beskrivelse af - og opgaver med - de tre former for sandsynlighed, som er omtalt i læseplanen for 7.- 9.
Kapitlet indledes med en beskrivelse af - og opgaver med - de tre former for sandsynlighed, som er omtalt i læseplanen for 7.- 9. klassetrin: statistisk sandsynlighed, kombinatorisk sandsynlighed og personlig
Læs mereKursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo
Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte
Læs mereIndblik i statistik - for samfundsvidenskab
Indblik i statistik - for samfundsvidenskab Læs mere om nye titler fra Academica på www.academica.dk Nikolaj Malchow-Møller og Allan H. Würtz Indblik i statistik for samfundsvidenskab Academica Indblik
Læs mereKapitel 7 Forskelle mellem centraltendenser
Kapitel 7 Forskelle mellem centraltendenser Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 / 29 Indledning 1. z-test for ukorrelerede data 2. t-test for ukorrelerede data med ens
Læs mereEnsidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese
Kursus 02402 Introduktion til Statistik Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Per Bruun Brockhoff DTU Compute, Statistik Bygning 305/324 Danmarks Tekniske Universitet
Læs mereEt oplæg til dokumentation og evaluering
Et oplæg til dokumentation og evaluering Grundlæggende teori Side 1 af 11 Teoretisk grundlag for metode og dokumentation: )...3 Indsamling af data:...4 Forskellige måder at angribe undersøgelsen på:...6
Læs mereGennemsnit og normalfordeling illustreret med terningkast, simulering og SLUMP()
Gennemsnit og normalfordeling illustreret med terningkast, simulering og SLUMP() John Andersen, Læreruddannelsen i Aarhus, VIA Et kast med 10 terninger gav følgende udfald Fig. 1 Result of rolling 10 dices
Læs mereLøsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06)
Afdeling for Biostatistik Bo Martin Bibby 23. november 2006 Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06) Vi betragter 4699 personer fra Framingham-studiet. Der er oplysninger om follow-up
Læs mereHvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05
Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ
Læs mereBrugertilfredshedsundersøgelse i Visitationsenheden 2011
Brugertilfredshedsundersøgelse i Visitationsenheden 2011 Indholdsfortegnelse 1. Indledning... 3 1.1 Baggrund... 3 1.2 Formål... 3 1.3 Metode... 4 2. Resultater... 5 2.1 Køn og alder... 6 2.2 Samlet tilfredshed,
Læs mereProdukt og marked - matematiske og statistiske metoder
Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet February 19, 2016 1/26 Kursusindhold: Sandsynlighedsregning og lagerstyring
Læs mereStatistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test
Statistik Lektion 0 Ikkeparametriske metoder Repetition KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,
Læs mereNormalfordelingen og Stikprøvefordelinger
Normalfordelingen og Stikprøvefordelinger Normalfordelingen Standard Normal Fordelingen Sandsynligheder for Normalfordelingen Transformation af Normalfordelte Stok.Var. Stikprøver og Stikprøvefordelinger
Læs mere1 Hb SS Hb Sβ Hb SC = , (s = )
PhD-kursus i Basal Biostatistik, efterår 2006 Dag 6, onsdag den 11. oktober 2006 Eksempel 9.1: Hæmoglobin-niveau og seglcellesygdom Data: Hæmoglobin-niveau (g/dl) for 41 patienter med en af tre typer seglcellesygdom.
Læs mereMEGAFON. Vi kender danskerne. 1g.megafon.dk. Rådgivning og analyse, der bringer dig godt videre
MEGAFON Vi kender danskerne Rådgivning og analyse, der bringer dig godt videre 1g.megafon.dk En god markedsanalyse kræver kun 2 ting: Almindelig sund fornuft Tænk jer godt og grundigt om. Er alt klart,
Læs mereTrin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse
Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ
Læs mereAppendiks A. Entreprenørskabsundervisning i befolkningen, specielt blandt unge
Appendiks A. Entreprenørskabsundervisning i befolkningen, specielt blandt unge Redegørelsen ovenfor er baseret på statistiske analyser, der detaljeres i det følgende, et appendiks for hvert afsnit. Problematikken
Læs mereProjekt 9.4 Darwins, Mendels og Hardy Weinbergs arvelighedslove
Projekt 9.4 Darwins, endels og Hardy Weinbergs arvelighedslove (Projektet kan indgå som en del af et studieretningssamarbejde. Vores definition af sandsynligheder er enten empirisk begrundet eller eksperimentelt
Læs mere- Panelundersøgelse, Folkeskolen, februar 2013 FOLKESKOLEN. Undersøgelse om syn på kønnets betydning for fag- og uddannelsesvalg
FOLKESKOLEN Undersøgelse om syn på kønnets betydning for fag- og uddannelsesvalg 2013 Udarbejdet af Scharling Research for redaktionen af Folkeskolen, februar 2013 Formål Scharling.dk Side 1 af 14 Metode
Læs mereLineære sammenhænge, residualplot og regression
Lineære sammenhænge, residualplot og regression Opgave 1: Er der en bagvedliggende lineær sammenhæng? I mange sammenhænge indsamler man data som man ønsker at undersøge og afdække eventuelle sammenhænge
Læs mere1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau...
Indhold 1 Statistisk inferens: Hypotese og test 2 1.1 Nulhypotese - alternativ.................................. 2 1.2 Teststatistik........................................ 3 1.3 P-værdi..........................................
Læs mereKort gennemgang af Samfundsfaglig-, Naturvidenskabeligog
Kort gennemgang af Samfundsfaglig-, Naturvidenskabeligog Humanistisk metode Vejledning på Kalundborg Gymnasium & HF Samfundsfaglig metode Indenfor det samfundsvidenskabelige område arbejdes der med mange
Læs mereTema. Dagens tema: Indfør centrale statistiske begreber.
Tema Dagens tema: Indfør centrale statistiske begreber. Model og modelkontrol Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. konfidensintervaller Vi tager udgangspunkt i Ex. 3.1 i
Læs mereEn intro til radiologisk statistik. Erik Morre Pedersen
En intro til radiologisk statistik Erik Morre Pedersen Hypoteser og testning Statistisk signifikans 2 x 2 tabellen og lidt om ROC Inter- og intraobserver statistik Styrkeberegning Konklusion Litteratur
Læs mereKønsproportion og familiemønstre.
Københavns Universitet Afdeling for Anvendt Matematik og Statistik Projektopgave forår 2005 Kønsproportion og familiemønstre. Matematik 2SS Inge Henningsen februar 2005 Indledning I denne opgave undersøges,
Læs mereDagens program. Praktisk information: Husk evalueringer af kurset
Dagens program Praktisk information: Husk evalueringer af kurset Hypoteseprøvning kap. 11.1-11.3 Fokastelsesområdet kap. 11.1 Type I og Type II fejl kap. 11.1 Styrkefunktionen kap. 11.2 Stikprøvens størrelse
Læs mereDen danske befolknings deltagelse i medicinske forsøg og lægevidenskabelig forskning
december 2006 j.nr.1.2002.82 FKJ/UH Den danske befolknings deltagelse i medicinske forsøg og lægevidenskabelig forskning omfang, befolkningens vurderinger Af Finn Kamper-Jørgensen og Ulrik Hesse Der er
Læs mereLidt historisk om chancelære i grundskolen
Lidt historisk om chancelære i grundskolen 1976 1.-2.klassetrin Vejledende forslag til læseplan:.det tilstræbes endvidere at eleverne i et passende talmaterialer kan bestemme for eksempel det største tal,
Læs mereKundeundersøgelse uge 40 2012
Kundeundersøgelse uge 40 5 Vejledende kvalitetsindeks - Lokalbanen 4 3,75 3,78 3,79 3,95 3,99 4,09 4,07 4,08 4,09 3 2 1 2003 2004 2006 2007 2008 2009 2010 2011 Indholdsfortegnelse Baggrund for undersøgelse...
Læs mereRisikofaktorudviklingen i Danmark fremskrevet til 2020
23. marts 9 Arbejdsnotat Risikofaktorudviklingen i Danmark fremskrevet til Udarbejdet af Knud Juel og Michael Davidsen Baseret på data fra Sundheds- og sygelighedsundersøgelserne er der ud fra køns- og
Læs mereProjekt 6.1 Rygtespredning - modellering af logistisk vækst
Projekt 6.1 Rygtespredning - modellering af logistisk vækst (Projektet anvender værktøjsprogrammet TI Nspire) Alle de tilstedeværende i klassen tildeles et nummer, så med 28 elever i klassen uddeles numrene
Læs mereDig og din puls Lærervejleding
Dig og din puls Lærervejleding Indledning I det efterfølgende materiale beskrives et forløb til matematik C, hvori eleverne skal måle hvilepuls og arbejdspuls og beskrive observationerne matematisk. Materialet
Læs mereHvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau
Hvad skal vi lave? 1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ. Teststatistik P-værdi Signifikansniveau 2 t-test for middelværdi Tosidet t-test for middelværdi Ensidet t-test for middelværdi
Læs mereOversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff
Kursus 02402 Introduktion til Statistik Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800
Læs mereBilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen
Bilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen Microsoft Excel har en del standard anvendelsesmuligheder i forhold til den beskrivende statistik og statistisk
Læs mere