Workshop i hypotesetest



Relaterede dokumenter
Vejledende eksamensopgaver vedr. hypotesetest (stx B og stx A)

MATEMATIK A-NIVEAU. Anders Jørgensen & Mark Kddafi. Vejledende eksempler på eksamensopgaver og eksamensopgaver i matematik, 2012

At træffe sine valg i en usikker verden - eller den statistiske modellerings rolle.

KURSUSMATERIALE TIL DET NYE STATISTIKPENSUM

Statistik med TI-Nspire CAS version 3.2. Bjørn Felsager September [Fjerde udgave]

2 -test. Fordelingen er særdeles kompleks at beskrive med matematiske formler. 2 -test blev opfundet af Pearson omkring år 1900.

Lars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ 2 -test og Goodness of Fit test.

Velkommen til Flemmings store Maplekursus 1. lektion. Skift mellem tekst- og matematikmode

for gymnasiet og hf 2016 Karsten Juul

for gymnasiet og hf 2017 Karsten Juul

for matematik pä B-niveau i hf

Matematik A. Studentereksamen. Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet

Schweynoch, Se eventuelt

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Spørgeskemaundersøgelser og databehandling

c) For, er, hvorefter. Forklar.

Personlig stemmeafgivning

Værktøjshjælp for TI-Nspire CAS Struktur for appendiks:

I. Deskriptiv analyse af kroppens proportioner

CMU PROJEKT HYPOTESETEST OG SIMULERING MICHAEL AGERMOSE JENSEN CHRISTIANSHAVNS GYMNASIUM

χ 2 -test i GeoGebra Jens Sveistrup, Gammel Hellerup Gymnasium

Statistik II 1. Lektion. Analyse af kontingenstabeller

Fagligt samspil mellem Ma-B og SA-A Lisbeth Basballe, Mariagerfjord Gymnasium og Marianne Kesselhahn, Egedal Gymnasium og HF

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Uafhængighedstestet

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]

Kapitel 8 Chi-i-anden (χ 2 ) prøven

(Projektets første del er rent deskriptiv, mens anden del peger frem mod hypotesetest. Projektet kan gemmes til dette emne, eller tages op igen der)

Statistik. Peter Sørensen: Statistik og sandsynlighed Side 1

ØVELSER Statistik, Logistikøkonom Lektion 8 og 9: Simpel og multipel lineær regression

Vejledende besvarelser til opgaver i kapitel 14

Statistik viden eller tilfældighed

STUDENTEREKSAMEN MATHIT PRØVESÆT MAJ MATEMATIK A-NIVEAU. MATHIT Prøvesæt Kl STXA-MATHIT

for matematik pä B-niveau i hf

Hvad er meningen? Et forløb om opinionsundersøgelser

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0

Vejledende løsninger kapitel 9 opgaver

Deskriptiv statistik for hf-matc

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau

J E T T E V E S T E R G A A R D

3. Trekantsberegninger. Gør rede for cosinusrelationen i vilkårlige trekanter.

Eksempel på besvarelse af spørgeordet Hvad kan udledes (beregn) inkl. retteark.

1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau...

Ovenstående figur viser et (lidt formindsket billede) af 25 svampekolonier på en petriskål i et afgrænset felt på 10x10 cm.

Konfidensintervaller og Hypotesetest

Resumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se

Forelæsning 9: Inferens for andele (kapitel 10)

Deskriptiv statistik for matc i stx og hf

Matematik B. Højere handelseksamen. Vejledende opgave 1

ØVELSER Statistik, Logistikøkonom Lektion 8 og 9: Simpel og multipel lineær regression

Hypotesetests, fejltyper og p-værdier

Løsning til opgave 7, 9, 10 og 11C Matematik B Sommer 2014

Kapitel 7 Forskelle mellem centraltendenser

Maple-oversigt til matematik B-niveau: Rungsted Gymnasium Definer en funktion og funktionsværdier. Tegn grafen for en funktion.

Rettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

Statistik II 1. Lektion. Sandsynlighedsregning Analyse af kontingenstabeller

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06)

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

STUDENTEREKSAMEN MATHIT PRØVESÆT MAJ MATEMATIK B-NIVEAU. MATHIT Prøvesæt Kl STXB-MATHIT

Radius Kommunikation // November Troværdighedsundersøgelsen 2016

Flemmings Maplekursus 1. Løsning af ligninger

Matematik B. Højere handelseksamen

MEGAFON. Vi kender danskerne. 1g.megafon.dk. Rådgivning og analyse, der bringer dig godt videre

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

LÆRERVEJLEDNING. Fattigdom og ulighed

Deskriptiv statistik. Version 2.1. Noterne er et supplement til Vejen til matematik AB1. Henrik S. Hansen, Sct. Knuds Gymnasium

Betinget fordeling Uafhængighed. Beregning af forventet tabel Chi-kvadrat teststatistik Chi-kvadrat test. Chi-kvadratfordelingen Agresti - Summary

Et statistisk test er en konfrontation af virkelighenden (data) med en teori (model).

5.11 Middelværdi og varians Kugler Ydelse for byg [Obligatorisk opgave 2, 2005]... 14

Matematik B. Højere handelseksamen

02402 Løsning til testquiz02402f (Test VI)

Matematik B. Studentereksamen. Onsdag den 7. december 2016 kl stx163-mat/b

Løs nu opgaverne i a) brug alt materialet her samt evt. regnearkene i Fronter som hjælp.

Eksempel på logistisk vækst med TI-Nspire CAS

GL. MATEMATIK B-NIVEAU

Hvad er skriftlig samfundsfag. Redegør

Flertal for offentliggørelse af skoletests men størst skepsis blandt offentligt ansatte

Gallup for Sex og Samfund

Matematik B. Højere handelseksamen

Mattip om. Statistik 2. Tilhørende kopier: Statistik 3, 4 og 5. Du skal lære om: Faglig læsning. Chance og risiko. Sandsynlighed

Test nr. 6 af centrale elementer 02402

Samfundsfag og matematik

Løsninger til kapitel 5

FADLs 12. semesterundersøgelse efteråret 2013

Teoretisk Statistik, 2. december Sammenligning af poissonfordelinger

Det gode liv Et uddrag af resultaterne fra borgerpanelsundersøgelsen. Analyse, Viden & Strategi Efteråret 2017

Gallup om KV13. National prognose. Gallup om KV13. TNS Dato: 18. november 2013 Projekt: 59618

MATEMATIK B til A Vejledende løsning på eksamensopgaven fra 27 maj 2016 STX

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Stratificerede analyser

MATEMATIK A-NIVEAU 2g

Oversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff

Lidt historisk om chancelære i grundskolen

Øvelser til basalkursus, 2. uge

(studienummer) (underskrift) (bord nr)

Lars Barfoed går af som formand. Lyngallup. Lars Barfoed går af som formand. TNS Dato: 2013 Projekt: 61318

Surveyundersøgelse af danske kiropraktorpatienter

Appendiks A. Entreprenørskabsundervisning i befolkningen, specielt blandt unge

Transkript:

Workshop i hypotesetest Indholdsfortegnelse: Velkommen til TI-Nspire CAS version 3.2 Simple øvelser i chi2-test: Chi2-test I: Goodness-of-fit test side 1 Chi2-test II: Uafhængighedstest side 3 Vejledende eksamensopgaver i chi2-test mm. side 8 Projekter til hypotesetest side 14 Bjørn Felsager rev. 2011 337

Simple øvelser i chi2-test: Chi2-test I: Goodness-of-fit test Bemærkning: Øvelsesopgaverne kan løses eksperimentelt ud fra en simulering af nulhypotesen eller teoretisk ud fra et kanonisk test indbygget i dit værktøjsprogram. I begge tilfælde bør man indlede med en deskriptiv analyse af data, hvor man inddrager grafiske fremstillinger og kommenterer, hvorvidt graferne synes at understøtte nulhypotesen eller den alternative hypotese. Opgave 1: Der fødes erfaringsmæssigt lidt flere kvinder end mænd. I Danmark synes der således i gennemsnit at fødes 51 kvinder for hver gang der fødes 49 mænd. I forbindelse med en statistik undersøgelse over en bestemt periode, hvor der blev født 186 børn på en bestemt fødeafdeling viste det sig at de 107 var piger og der resterende 79 var mænd. Er fødslerne på denne fødeafdeling i statistik overensstemmelse med den generelle danske befolkning? Opgave 2: Du har en mistanke om, at én af dine venner har en falsk terning. Derfor har du i al hemmelighed noteret udfaldet af alle vedkommendes kast med terningen gennem en hel aftens spil. Dine optegnelser viser, at terningen er endt på 1 i alt 5 gange, 2 i alt 4 gange, 3 i alt 5 gange, 4 i alt 6 gange, 5 i alt 5 gange og 6 i alt 13 gange. Giver dine observationer anledning til at din mistanke bestyrkes? Du forventes at argumentere ud fra statistiske hypoteser og test, med berøring af begreber som signifikans og/eller p-værdi. Desuden forventes du at kommentere, hvilke konsekvenser du vil lade den statistiske analyse få i den konkrete problemstilling. Opgave 3: En mindre restaurant med et menukort bestående af 5 forskellige, men faste menuer plejer at have følgende ordrefordeling på disse: menu 1: 30 %, menu 2: 25 %, menu 3: 20 %, menu 4: 15 % og menu 5: 10 %. Restauranten foretager sine indkøb for at imødegå en efterspørgsel, der følger dette mønster. Imidlertid er man flere gange i den seneste tid løbet tør for menu 5, og man ønsker at afgøre, om det er en tilfældighed, eller om man skal revidere indkøbsplanerne. I den seneste uge har man haft 543 gæster. Af disse bestilte 152 menu 1, 101 bestilte menu 2, 110 bestilte menu 3, 91 bestilte menu 4 og 89 bestilte menu 5. Skal man revidere indkøbsplanerne? Velkommen til TI-Nspire CAS version 3.2 1 338

Opgave 4: Når man fremstiller almindelige M&M-slikpiller, blander man de forskellige farver tilfældigt efter det følgende skema: Farve Rød gul grøn orange brun blå Generel andel 20% 20% 10% 10% 30% 10% For at undersøge om den samme fordeling holder for peanut-m&m-piller blev der udtaget en tilfældig stikprøve på 75 peanut-piller, der fordelte sig således efter farve: Farve Rød gul grøn orange brun blå Observeret antal 11 16 8 5 17 18 Fremstil en passende graf, der sammenligner frekvenserne for almindeligt M&M og peanut-m&m. Kommenter grafen med brug af begrebet stikprøve. Formuler hypoteserne for et statistisk test hørende til den ovenstående undersøgelse. Udregn de forventede antal under antagelse af nulhypotesen H 0 : Farve Rød gul Grøn orange brun blå Forventet antal Udregn χ 2 -teststørrelsen og find p-værdien. Er forskellen mellem de observerede og forventede antal signifikant på 5%-niveau? På 1%-niveau? Konklusion? Opgave 5 (tillempet efter vejledende eksamensopgave 11) Ved folketingsvalget i 2007 fordelte stemmerne sig således Parti S Rad Kons SF DF V EL Lib. All. Kr. Dem. Stemmer i % 25,5 5,1 10,4 13,0 13,8 26,3 2,2 2,8 0,9 Ved en meningsmåling med 968 respondenter foretaget af Greens Analyseinstitut 1/2 3/2 fordelte stemmerne sig således Parti S Rad Kons SF DF V EL Lib. All. Kr. Dem. Stemmer i % 26,3 5,4 9,6 16,9 14,2 24,0 2,1 1,1 0,5 Vi vil anvende meningsmålingen til at undersøge følgende nulhypotese: stemmefordelingen er uændret in forhold til valget. a) Hvad er populationen og hvad er stikprøven. Lav en tabel over de observerede antal stemmer og de forventede antal stemmer under nulhypotesen. b) Bestem teststørrelsen, der tester om hypotesen skal accepteres eller forkastes, og afgør på et 5% signifikansniveau om man kan sige, at stemmefordelingen har ændret sig. c) Det ser ud som om, partiet SF har haft betydelig fremgang. Opstil en tabel inddelt efter SF og øvrige partier for såvel observerede som forventede værdier og afgør med statistiske metoder om SF s fremgang er signifikant på 5% niveau. 2 339

Chi2-test II: Uafhængighedstest Bemærkning: Øvelsesopgaverne kan løses eksperimentelt ud fra en simulering af nulhypotesen eller teoretisk ud fra et kanonisk test indbygget i dit værktøjsprogram. I begge tilfælde bør man indlede med en deskriptiv analyse af data, hvor man inddrager grafiske fremstillinger og kommenterer, hvorvidt graferne synes at understøtte nulhypotesen eller den alternative hypotese. Opgave 6: I dagens politik spiller skattenedsættelser en stor rolle. Et stort antal lønarbejdere udspørges via et telefoninterview om deres holdning til en lønnedgang, der kompenseres med en skattenedsættelse: Vil du acceptere en lønnedsættelse, hvis den kompenseres med en skattenedsættelse, således at reallønnen (købekraften) er uændret? Svarene fordeler sig således på køn: Observeret Kvinde Køn Mand Ja 187 159 Nej 105 56 Fremstil tabellen grafisk i et passende diagram og kommentér fordelingen for holdningen som funktion af kønnet. Færdigudfyld den følgende tabel: Observeret Køn Kvinde Mand I alt Ja 187 159 Nej 105 56 I alt Udregn tabellen for de forventede antal: Forventet Holdning Holdning Holdning Ja Nej I alt Køn Kvinde Mand I alt Udregn χ 2 -teststørrelsen og find p-værdien. Er forskellen mellem de observerede og forventede svar signifikant på 5% niveau? På 1% niveau? 3 340

Opgave 7: I en Gallupundersøgelse blev 234 kvinder og 257 mænd spurgt om de var tilfredse med deres udseende, i den forstand, at de anså sig selv som fysisk tiltrækkende for det modsatte køn. Hertil svarede (i afrundede procenttal) 71% af kvinderne, at de var tilfredse med deres udseende, mens 81% af mændene svarede, at de var tilfredse med deres udseende. Færdigudfyld det følgende skema Velkommen til TI-Nspire CAS version 3.2 Køn Kvinde Mand I alt Selvopfattelse Tilfreds Utilfreds I alt 234 257 Fremstil tabellen grafisk i et passende diagram og kommentér fordelingen af selvopfattelsen som funktion af kønnet. Hvor stor en andel af samtlige adspurgte er tilfredse? Utilfredse? Udregn χ 2 -teststørrelsen og p-værdien. Er forskellen mellem de observerede og forventede svar signifikant på 5% niveau? På 1% niveau? Opgave 8: Det er en velkendt opfattelse at psykologiske og sociale forhold har indflydelse på overlevelseschancen efter en alvorlig sygdom. En undersøgelse fra 1980 handlede om en eventuel sammenhæng mellem kæledyr og chancen for at overleve i mindst et år efter en hjerteoperation. I undersøgelsen, der omfattede 53 patienter med kæledyr og 39 patienter uden kæledyr, var 78 af patienterne i live efter et år. Af de 78 patienter, der overlevede havde de 50 kæledyr. Er der belæg i undersøgelsen for en statistisk sammenhæng mellem at overleve i mindst et år og at have kæledyr? Opgave 9: I en undersøgelse af danske mænds og kvinders tv forbrug svarer 60% af kvinderne i stikprøven, at de ser mere end 20 timer tv om ugen, mens det tilsvarende tal for mændene er 53%. Stikprøven indeholder lige mange personer af hver køn, og hypotesen lige mange mænd og kvinder ser mere end 20 timer tv om ugen forkastes på 5% signifikansniveau, men accepteres på 1% signifikansniveau. Bestem en mulig størrelse af stikprøven. 4 341

Opgave 10: En amerikansk undersøgelse af bilisters brug af sikkerhedsseler resulterede i følgende stikprøve: Køn Mand Kvinde Brug af sikkerhedssele Altid 37 39 Som regel 60 58 Af og til 54 49 Aldrig 64 39 Opstil den relevante nulhypotese for at undersøge, om der er uafhængighed mellem køn og brug af sikkerhedssele? Fremstil tabellen i et passende diagram, der viser fordelingen af brugen af sikkerhedsselen som funktion af kønnet og kommentér diagrammet. Udregn tabellen med de forventede værdier og χ 2 -teststørrelsen Giver stikprøven grundlag for at sige, at der er forskel på de to køns brug af sikkerhedsseler? Opgave 11: Antag at en dyrlæge har fået en mistanke om, at hunde af racen labrador har en større tendens til at udvikle allergi end andre hunderacer. Gennem det sidste år er der i klinikken blevet registret følgende undersøgelser og resultater af allergi hos hunde (Bemærk: Tallene er fiktive!): Allergi Race Labrador Schæfer Puddel Andet Ingen allergi 25 32 28 64 Mild allergi 2 0 3 7 Allergi 10 7 4 8 Opstil den relevante nulhypotese for at undersøge, om der er uafhængighed mellem hunderace og udvikling af allergi. Udregn tabellen med de forventede værdier. Vil det være rimeligt at bruge en χ 2 -fordeling til at vurdere teststørrelsen her? Hvis ikke, hvordan kan man så komme videre med undersøgelsen? Giver stikprøven grundlag for at sige, at der er forskel på risiko for at udvikle allergi for forskellige hunderacer? 5 342

Opgave 12 (Tillempet fra Susanne Christensens elevtekst) En hjerneforsker forsker i forskellige måder at operere for en bestemt type hjernetumor. Der er tre forskellige operationstyper: Type A, hvor man kun fjerner selve tumoren; Type B, hvor man også tager lidt af det nærmeste omkringliggende væv bort, og Type C, hvor der fjernes en større del af det omkringliggende væv. Lægen ønsker at vide, hvordan operationstypen indvirker på chancen for at overleve et halvt år efter operationen. Over en årrække har lægen indsamlet følgende data over resultaterne af operationerne (Bemærk: data er fiktive, problemstillingen er autentisk) Observeret Status A B C I alt I live 40 10 9 59 Død 14 6 16 36 I alt 54 16 25 95 Fremstil tabellen grafisk i et passende diagram, der viser fordelingen af status efter et halvt år som funktion af operationstypen og kommentér diagrammet. Udregn tabellen for de forventede antal Status Forventet A Velkommen til TI-Nspire CAS version 3.2 B C I alt I live 59 Død 36 I alt 54 16 25 95 Udregn χ 2 -teststørrelsen og find p-værdien. Er forskellen mellem de observerede og forventede resultater signifikant på 5% niveau? På 1% niveau? Udregn tabellen for de enkelte cellers bidrag til 2 -teststørrelsen Forventet A B C I alt Status I live Død I alt Konklusion: Hvad bør lægen anbefale vedrørende de fremtidige operationstyper? 6 343

Da lægen sender sine konklusioner ind til et tidsskrift spørger en referee (dvs. en anden læge, der kommenterer artiklen før den offentliggøres) vores læge, om han har styr på eventuelt skjulte variable: Er det helt tilfældigt hvilke patienter, der tilbydes hvilke operationer? Lægen opdager da, at hospitalet faktisk tager hensyn til patientens alder, når de anbefaler hvilken operation de skal underkastes. For patienter med en alder på over 50 år (gamle patienter) fandt lægen nu de følgende (fiktive!) hyppigheder: Status A B C I alt I live 13 8 8 29 Død 13 6 16 35 I alt 26 14 24 64 Gentag nu undersøgelsen og diskutér i lyset af din nye undersøgelse lægens konklusion fra før. Opgave 13 (Tillempet efter vejledende eksamensopgave 7) En klasse vil undersøge, om drikkevaner er uafhængige af køn. Drikkevanerne inddeles i tre grupper: Drikker ofte, drikke en gang i mellem, drikker aldrig. Resultatet af elevernes undersøgelser fremgår af følgende tabel: 335 elevers fordeling på drikkevaner Drikker ofte Drikker af og til Drikker ikke Pige 22 39 10 71 Dreng 43 180 41 264 66 218 51 335 a) Giver resultatet belæg for at antage, at drikkevaner er uafhængige af køn, når der vælges et signifikans-niveau på 5 %? b) Undersøgelsen kritiseres for, at inddelingen mellem drikker ofte og drikker af og til er uklar. Optil selv ud fra tallene en ny tabel over de 335 elever hvor du kun anvender to inddelingskriterier, og undersøg om man når til samme konklusion nu som man gjorde i spørgsmål a. 7 344

Vejledende eksamensopgaver i chi2-test mm. Bemærkning: De vejledende eksamensopgaver kan løses teoretisk ud fra et kanonisk test indbygget i dit værktøjsprogram eller ved hjælp af de indbyggede fordelingsfunktioner for chi2-fordelingen, dvs. punktfordelingen, den kumulerede fordeling og den inverse fordeling. Opgave 1 (vejledende eksamensopgave 8) For en bestemt storproducent af legetøjsbolde gælder at diameteren af legetøjsboldene opfylder Mindre end 20cm Mellem 20cm og 22cm Over 22 cm 10% 85% 5% En forsendelse på 200 legetøjsbolde stoppes i tolden. Fordelingen af diameteren af disse legetøjsbolde er Mindre end 20cm Mellem 20cm og 22cm Over 22 cm 28 stk. 160 stk. 12 stk. a) Benyt statistiske metoder til at undersøge om forsendelsen kan stamme fra storproducenten. Opgave 2 (vejledende eksamensopgave 9) I et eksperiment krydser en studerende lyserøde blomster med hinanden. Ifølge arvelighedslovene skulle det forventede resultat være 25 % røde, 50 % lyserøde og 25 % hvide. Resultatet af eksperimentet blev 236 blomster, der fordelte sig på farverne som vist i tabellen: Eksperimentets fordeling af 236 blomster på tre farver Farve rød lyserød hvid hyppighed 66 115 55 a) Beregn ud fra arvelighedsloven de forventede hyppigheder for de tre farver. b) Bestem χ 2 -teststørrelsen. Skriv et forslag til hvilken konklusion, den studerende kan skrive i sin rapport, når der anvendes et signifikansniveau på 5 %? 8 345

Opgave 3 (vejledende eksamensopgave 10) I klageafdelingen i et firma modtager man klager pr. telefon. Firmaet har erfaring for, at klagebehandlingstiden pr. klage fordeler sig som angivet i nedenstående tabel. Antal minutter 0-5 5-10 10-15 >15 I alt Andel af det samlede antal klager 30% 40% 20% 10% 100% Ved en kontroloptælling i en bestemt måned, viste det sig, at klagebehandlingstiden pr. klage fordelte sig som vist i tabellen nedenfor. Klagebehandlingstid 0-5 5-10 10-15 >15 I alt Observeret 37 53 25 5 120 a) Hjælp firmaet med at opstille en nulhypotese, der kan testes. Undersøg dernæst om man på et 5% signifikansniveau kan sige, at mønstret i klagebehandlingstiden har ændret sig. Kilde: http://www.business.aau.dk/hd/statistik/dokumenter%20rie/hold%20a3_09 /lektion%207/kap%20h%20goodness%20of%20fit%20test.doc Opgave 4 (Vejledende eksamensopgave 1) I nedenstående tabel ses resultaterne af samtlige hjerteklapoperationer i 2007-08 ved Odense Universitetshospital (OUH) sammenlignet med resultaterne ved landets øvrige hjertecentre. Død indenfor 30 dage efter operation Overlevet de første 30 dage OUH 11 206 De øvrige hjertecentre 32 1374 a) Undersøg på 5%-signifikansniveau, om dødelighed indenfor 30 dage efter en hjerteklapoperation er ens ved OUH og de øvrige hjertecentre. b) Hvad ville resultatet være blevet, hvis vi havde valgt et signifikansniveau på 1%? Inddrag det statistiske begreb skjulte variable i din kommentar til resultatet. Kilde: http://www.si-folkesundhed.dk/upload/dhr2008.pdf 9 346

Opgave 5 (Vejledende eksamensopgave 4) I en klinisk afprøvning af en bestemt type medicin på en bestemt alvorlig sygdom, har man opdelt de lige behandlingskrævende patienter i to grupper A og B. Gruppe A får medicinen, mens gruppe B er kontrolgruppe, som derfor får placebo (fx kalktabletter). Ingen af grupperne ved, hvilken type behandling de får. Efter 6 måneders behandling undersøger man virkningen af behandlingen i hver af de to grupper, og resultatet af denne undersøgelse ses i tabellen nedenfor. Status efter 6 mdr. Gruppe A Gruppe B I alt Død 8 17 25 Overlevende 75 48 123 I alt 83 65 148 I det følgende antages, at der ikke er nogen sammenhæng mellem medicineringen og patienternes overlevelseschancer. a) Opstil en tabel over de forventede værdier for Død og Overlevende i de to grupper A og B. b) Undersøg om medicineringen kan siges at have betydning for patienternes overlevelseschancer når signifikansniveauet fastlægges til 5%? Opgave 6 (Vejledende eksamensopgave 5) Hjerte- og lungeoperationer kan medføre forstoppelse (postoperativ obstipation). På et hospital er man interesseret i at undersøge, om problemet har samme omfang ved de to operationstyper. De opstiller dette som en hypotese, de vil teste, og beder alle hjemsendte hjerte- og lungepatienter svare på følgende spørgsmål: Har du efter operationen haft forstoppelse i en grad, der har påvirket dine daglige gøremål? Patienternes svar fremgår af tabellen nedenfor, hvor tallene i parentes angiver de forventede værdier for patienternes svar. stype \ Problemer Ja Nej Total Hjerteoperation 9 (12,97) 51(47,03) 60 Lungeoperation 15(11,03) 36 (39,97) 51 Total 24 87 111 a) Gør rede for, hvordan de forventede værdier er beregnet. b) Bestem χ 2 -teststørrelsen, og den tilsvarende p-værdi og kommenter resultatet. Kilde: http://www.nhv.se/upload/dokument/forskning/publikationer/mph/2008/mp H2008-8_L%20S%20Rasmussen.pdf 10 347

Opgave 7 (Vejledende eksamensopgave 6) I en undersøgelse på en skole har en gruppe elever bedt 179 elever om at angive køn og rygevaner. En optælling viser, at der 36 rygere og 143 ikke-rygere blandt de adspurgte. Endvidere viser optællingen, at der ud af de 179 var 78 piger og 101 drenge. Det antages, at det er uafhængigt af køn, hvorvidt en elev ryger eller ej. a) Bestem under denne antagelse det forventede antal rygere blandt drenge, og udfyld de tomme pladser i skema 1 over den forventede fordeling af eleverne på rygevaner og køn: Skema 1: Den forventede fordeling af elever på rygevaner og køn Ryger Ikke-ryger Hunkøn 78 Hankøn 101 Sum 36 143 179 I skema 2 ses stikprøvens faktiske fordeling af eleverne på køn og rygevaner: Skema 2: Stikprøvens fordeling af elever på rygevaner og køn Ryger Ikke-ryger Hunkøn 21 57 78 Hankøn 15 86 101 Sum 36 143 179 b) Bestem χ 2 -teststørrelsen og den tilsvarende p-værdi. I en lignende undersøgelse kommer man frem til, at χ 2 -teststørrelsen er lig med 6,34. c) Giver denne undersøgelse belæg for at hævde, at rygevaner er uafhængige af køn, når der benyttes et signifikansniveau på 5 %? Opgave 8 (Vejledende eksamensopgave 2) I en opinionsundersøgelse i X-købing er 500 personer blevet spurgt, om man er for eller imod de ændrede åbningstider i svømmehallen. For Imod Ved ikke Sum Kvinder 151 79 34 264 Mænd 115 70 51 236 Sum 266 149 85 500 Det oplyses, at man har en hypotese om, at de to køn har samme indstilling. a) Udfyld, under antagelse af at hypotesen er sand, nedenstående tabel over den forventede fordeling. 11 348

For Imod Ved ikke Sum Kvinder 264 Mænd 236 Sum 266 149 85 500 b) Bestem χ 2 -teststørrelsen, og den tilsvarende p-værdi, og kommenter resultatet. Opgave 9 (Vejledende terminsprøve 2010 A-niveau Netadgangsforsøget i matematik) Den danske landsholdsmålmand i håndbold Kasper Hvidt havde ved EM i Norge i 2008 en redningsprocent på 40 %. Dvs. han reddede 40 % af de skud, som modstanderne skød på hans mål. Ved EM i Østrig 2010 reddede Kasper Hvidt i en bestemt kamp 11 skud ud af 36. a) Opstil en nulhypotese, og undersøg på et 5 % signifikansniveau, om Kasper Hvidts redningsprocent har ændret sig. Opgave 10 (Eksamensopgave 2010 A-niveau Netadgangsforsøget i matematik) På en skole undersøger elevrådet hvert år, hvor mange af skolens elever, der køber mad i kantinen. Sidste skoleår købte 45 % af eleverne mad i kantinen. Da skolen har mere end 1000 elever, vælger elevrådet at spørge 100 elever, om de køber mad i kantinen eller ej. Her viser det sig, at 56 ud af de 100 svarer ja til, at de køber mad i kantinen. a) Opstil en nulhypotese, og undersøg på et 5 % signifikansniveau om andelen af elever, der køber mad i kantinen, har ændret sig. Opgave 11 (udkast til fremtidige eksamensopgaver B-niveau fra Mathit-bogen) Pressede bakelitforme kan kasseres på grund af porøsitet eller på grund af dimensionsfejl. Ved sortering af 6805 pressede bakelitformstykker kasseredes 473 stykker på grund af dimensionsfejl. En nærmere undersøgelse af disse 473 stykker viste, at de 142 var porøse. Ved gennemgang af de resterende stykker kasseredes yderligere 1233 stykker på grund af porøsitet jf. tabellen nedenfor. Porøse Ikke-porøse I alt Med dimensionsfejl 142 331 473 Uden dimensionsfejl 1233 5099 6332 I alt 1375 5430 6805 12 349

Hvis vi antager, at porøsiteten er uafhængig af dimensionsfejlen, så får vi følgende tabel over de forventede værdier. Porøse Ikke-porøse I alt Med dimensionsfejl 95.57 377.43 473 Uden dimensionsfejl 1279.43 5052.57 6332 I alt 1375 5430 6805 Gør rede for, hvordan de forventede værdier er beregnet. Undersøg med en χ 2 -test, om der på signifikansniveauet 5% er belæg for at antage, at porøsiteten er uafhængig af dimensionsfejlen. Undersøgelsen skal inddrage χ 2 -værdien og p-værdien. Opgave 12: (udkast til fremtidige eksamensopgaver A-niveau fra Mathit-bogen) I en spørgeskemaundersøgelse stilles en repræsentativ stikprøve på 75 gymnasieelever to spørgsmål, spørgsmål A og spørgsmål B, hvortil de svarer enten JA eller NEJ. Der deltager 24 drenge i undersøgelsen, hvoraf de 10 svarer JA til spørgsmål A. I alt er der 24 gymnasieelever, der svarer JA til spørgsmål A. Undersøg med en χ 2 -test om der på signifikansniveauet 5 % er belæg for at antage, at holdningen til spørgsmål A er uafhængig af gymnasieelevens køn. Undersøgelsen skal inddrage χ 2 -værdien og p-værdien. Hvor stor skal χ 2 -værdien være i den tilsvarende undersøgelse af spørgsmål B, hvis man på signifikansniveauet 5 % skal kunne forkaste nulhypotesen om, at holdningen til spørgsmål B er uafhængig af gymnasieelevens køn? 13 350

Projekter til hypotesetest Velkommen til TI-Nspire CAS version 3.2 Projekt 1 (tillempet efter vejledende terminsprøve i netadgangsforsøget) Ved en konditionstest har man målt konditallet for 77 personer. I bilag 2 (Bilag2_Kondital_M_K.htm) findes testresultaterne opdelt efter køn. a) Tegn to boksplot, der viser fordelingen af kondital for henholdsvis mænd og kvinder. b) Beskriv forskellen på kvindernes og mændenes testresultater ud fra de to boksplot, idet kvartilsættene inddrages. c) Gennemfør en t-test for at vurdere om der er forskel på niveauerne i kondital for de to køn. Resultater fra konditionstest 77 personer fordelt efter køn NR Kondital Køn 1 61.7 mand 2 47 mand 3 41.6 mand 4 49.2 mand 5 47.9 mand 6 48.5 mand 7 53.5 mand 8 47.4 mand 9 52 mand 10 54.9 mand 11 38.9 mand 12 37.5 mand 13 44.2 mand 14 40.6 mand 15 54.9 mand 16 47 mand 17 43.9 mand 18 41.1 mand 19 30.9 mand 20 50.9 mand 21 56 mand 22 35.2 mand 23 50.9 mand 24 50.9 mand 25 52.3 mand 26 58.1 mand 14 351

27 55.5 mand 28 49.9 mand 29 55.5 mand 30 53.7 mand 31 52 mand 32 43.8 mand 33 50.9 mand 34 49.9 mand 35 53.7 mand 36 49.2 mand 37 50 mand 38 57.1 mand 39 41.1 mand 40 49.2 mand 41 40.3 mand 42 43.1 kvinde 43 34 kvinde 44 32.7 kvinde 45 33.2 kvinde 46 32.2 kvinde 47 27.1 kvinde 48 51.4 kvinde 49 49.2 kvinde 50 40.5 kvinde 51 36.7 kvinde 52 47 kvinde 53 46.3 kvinde 54 33.2 kvinde 55 41.6 kvinde 56 33.5 kvinde 57 33.2 kvinde 58 33.9 kvinde 59 31 kvinde 60 39.7 kvinde 61 34.6 kvinde 62 41.1 kvinde 63 42.4 kvinde 15 352

64 49.2 kvinde 65 34.3 kvinde 66 52.6 kvinde 67 50.9 kvinde 68 43 kvinde 69 34.3 kvinde 70 29.9 kvinde 71 43.9 kvinde 72 35.8 kvinde 73 41.6 kvinde 74 41 kvinde 75 34.6 kvinde 76 35.9 kvinde 77 27.1 kvinde Projekt 2: (tillempet efter vejledende eksamensopgave i samfundsfag) Bemærkning: I diskussionen inddrages passende diagrammer og udregninger af de viste tal i skemaet! 16 353

Projekt 3: Tillempet efter vejledende eksamensopgave i samfundsfag De viste tal stammer fra den følgende tabel: Uddannelse og timeløn I alt 10 20 ALMENGYM- GRUND NASIAL UDDAN- SKOLE NELSER 25 ERHVERVS- GYMNASIAL UDDANNELSER 35 ER- 40 KORTE VIDE- HVERVSUD- REGÅENDE DANNELSER UDDANNELSER 50 MELLEMLANGE VIDEREGÅENDE UDDANNELSER 60 BA- CHE- LOR 65 LANGE VIDE- REGÅENDE UDDANNELSER 70 FOR- SKERUD- DANNELSER Antal år i uddannelse 9 12 12 10 14 16 14 18 21 Fortjeneste i kr. pr. time. Privat sektor Mænd 2 0 0 7 197.87 239.11 225.25 242.91 267.42 334.61 283.75 376.21 418.71 10 20 ALMENGYM- GRUND NASIAL UDDAN- SKOLE NELSER 25 ERHVERVS- GYMNASIAL UDDANNELSER 35 ER- 40 KORTE VIDE- HVERVSUD- REGÅENDE DANNELSER UDDANNELSER 50 MELLEMLANGE VIDEREGÅENDE UDDANNELSER 60 BA- CHE- LOR 65 LANGE VIDE- REGÅENDE UDDANNELSER 70 FOR- SKERUD- DANNELSER Antal år i uddannelse 9 12 12 10 14 16 14 18 21 Fortjeneste i kr. pr. time. Privat sektor Kvinder 2 0 0 7 203.46 262.61 240.21 252.5 282.28 361.38 318.65 401.97 430.18 10 20 ALMENGYM- GRUND NASIAL UDDAN- SKOLE NELSER 25 ERHVERVS- GYMNASIAL UDDANNELSER 35 ER- 40 KORTE VIDE- HVERVSUD- REGÅENDE DANNELSER UDDANNELSER 50 MELLEMLANGE VIDEREGÅENDE UDDANNELSER 60 BA- CHE- LOR 65 LANGE VIDE- REGÅENDE UDDANNELSER 70 FOR- SKERUD- DANNELSER Antal år i uddannelse 9 12 12 10 14 16 14 18 21 Fortjeneste i kr. pr. time. Privat sektor Kilde: www.statistikban ken.dk 2 0 0 7 185.96 206.97 206.06 221.46 244.07 274.47 247.17 326.82 384.59 Bemærkning: I diskussionen inddrages såvel passende diagrammer og udregninger af de viste tal i skemaet som en lineær regressions-t-test for at vurdere statistisk signifikans! 17 354

Projekt 4: Her vil vi tage udgangspunkt i et eksempel, hvor man folder en trekant med et stykke A4-papir med henblik på at finde den størst mulige trekant: h g Ved en konkret opmåling af grundlinjer og højder for den skraverede trekant fås følgende mål: grundlinje højde 1 cm 10.5 cm 2 cm 10.4 cm 3 cm 10.35 cm 4 cm 10.1 cm 5 cm 9.95 cm 6 cm 9.7 cm 7 cm 9.3 cm 8 cm 9 cm 9 cm 8.6 cm 10 cm 8.2 cm 11 cm 7.7 cm 12 cm 7.1 cm 13 cm 6.6 cm 14 cm 5.9 cm 15 cm 5.2 cm 16 cm 4.5 cm 17 cm 3.6 cm 18 cm 2.9 cm 19 cm 2.0 cm 20 cm 1.0 cm Udvid tabellen så den også omfatter trekantens areal. Afbild et diagram, der viser arealets afhængighed af grundlinjen. Opstil en passende regressionsmodel for arealet som funktion af grundlinjen, idet du inddrager residualplot og forklaringsgrad i analysen. Gennemfør en regressions-t-test for arealet som funktion af grundlinjen, idet du inddrager passende potenser af grundlinjen som uafhængige variable i regressionsmodellen. Kommenter p-værdien for regressionsmodellen såvel som p-værdierne for koefficienterne i modellen. 18 355