Materialet på denne side er udarbejdet i forbindelse med et udviklingsprojekt under Undervisningsministeriet.

Størrelse: px
Starte visningen fra side:

Download "Materialet på denne side er udarbejdet i forbindelse med et udviklingsprojekt under Undervisningsministeriet."

Transkript

1 Materialet på denne side er udarbejdet i forbindelse med et udviklingsprojekt under Undervisningsministeriet. Statistiske metoder i faglige projekter hvor matematik er i samarbejde med samfundsfag og biologi Projekt Formålet var at undersøge mulighederne for et samarbejde mellem fagene matematik og biologi og matematik og samfundsfag med anvendelse af statistiske metoder. Resultatet er blevet et kursustilbud til lærere i matematik, biologi, samfundsfag og kemi en eksemplarisk spørgeskemaundersøgelse udført i et samarbejde mellem to gymnasier og med inddragelse af fagene matematik og samfundsfag materiale til lærere, der ikke føler sig sikre i statistikken - historier og eksempler på anvendelse af chi2-fordelingen og andre, som man kan støde på. materiale om chi2-test i biologi-matematik: eksempler og øvelser, hvor chi2-testet anvendes. Arbejdsgruppen har bestået af: Bjørn Felsager, (matematik-fysik, Emeritus) Bjørn Grøn (matematik, fagkonsulent) Helle Hvitved (matematik-biologi, Ribe Katedralskole) Helge Gram Christensen (matematik-datalogi, Varde Gymnasium) Jørgen Lassen (samfundsfag-historie, Sct. Knuds Gymnasium) Lisbeth Basballe (samfundsfag-fransk. Mariagerfjord Gymnasium) Marianne Kesselhahn (matematik-samfundsfag, Egedal Gymnasium og HF), Olav Lyndrup (matematik-datalogi, Nykøbing Katedralskole) Susanne Christensen, lektor og institutleder Ålborg Universitet Susanne Højte (matematik-biologi, Gladsakse Gymnasum),

2 Kursus - Naturvidenskabelig indsigt og samfundsmæssigt ansvar om EU s forvaltning af det marine miljø og de fornybare naturressourcer. Kursusudbyder Foreningen af lærere i samfundsfag (FALS) og Matematiklærerforeningen Kurset laves i samarbejde med: ICES (The International Council for the Exploration of the Sea). Formål At tilbyde et kursus om EU s forvaltning af det marine miljø og herunder arbejde med prognoser og beslutningsprocessen ud fra en kritisk tilgang. Indhold Hovedfokus er mødet mellem det forskningsbaserede rådgivningssystem og det politiske beslutningssystem. Kurset vil indeholde hands-on beregninger af trends af miljøforhold og af fiskekvoter som baggrund for den videnskabelige rådgivning. Der ses på processen fra de videnskabeligt funderede anbefalinger af regulering af den menneskelige påvirkning af havet til det politiske (EU) system, der træffer reguleringsbeslutninger. Der stilles skarpt på interessekonflikter. Arbejdsform Forelæsning/foredrag, hands-on workshops samt plenum diskussioner. Målgruppe Lærer og læreteams i studieretninger med, samfundsfag, matematik, biologi og kemi inden for gymnasieområdet (STX, HHX, HTX, samt HF) Undervisere (max. 80 anslag) Tid og sted Mandag den 21 november 2011 kl til tirsdag den 22.november kl ICES: H.C.Andersens Boulevard 44-46, 1553 København V Pris 2500,00 kr (kusus incl. en overnatning på Cab Inn, frokost samt et aftensmåltid.) Tilmelding Senest mandag den 1.november 2011 til Jørgen Lassen joergen.lassen1@skolekom.dk (Husk at skrive navn, skole og ean nummer) Kontakt Jørgen Lassen joergen.lassen1@skolekom.dk, eller Olav Lyndrup olav.lyndrup@nykat-gym.dk

3 Fagligt samspil mellem Ma-B og SA-A Lisbeth Basballe, Mariagerfjord Gymnasium og Marianne Kesselhahn, Egedal Gymnasium og HF Vi ønskede at planlægge og afprøve et undervisningsforløb, hvor anvendelse af statistiske metoder indgik i et meningsfuldt samspil mellem fagene Ma-B og SA-A. Årsagerne til at planlægge forløbet som et samarbejde mellem 2 gymnasier var både pædagogiske og faglige. Vi håbede på at styrke elevernes motivation, ved at de skulle sammenligne sig selv med elever fra et helt andet sted i landet, og vi håbede på, at resultaterne kunne sige noget fagligt relevant om forskellen på identitetsdannelsen på de to gymnasier. Så vi opstillede følgende formål med forløbet: At undersøge og sammenligne identitetsdannelse og socialisation hos 1.g er på Mariagerfjord Gymnasium og Egedal Gymnasium og HF efterår 2010 Det faglige mål, der kom i spil i samfundsfag skulle være: Socialisation, identitet, familien og det senmoderne samfund.forløbet skulle være med til at opfylde følgende faglige mål: o formulere præcise faglige problemstillinger, herunder operationaliserbare hypoteser, og indsamle, vurdere og bearbejde dansk og fremmedsproget materiale, herunder statistisk materiale, til at undersøge og diskutere problemstillinger og konkludere o anvende viden om samfundsvidenskabelig metode til kritisk at vurdere undersøgelser og til at gennemføre mindre empiriske undersøgelser o skelne mellem forskellige typer af argumenter, udsagn, forklaringer og teorier o formidle og tydeliggøre faglige sammenhænge og udviklingstendenser ved hjælp af foreliggende og egne beregninger, tabeller, diagrammer og modeller Følgende emner fra matematik skulle behandles i det konkrete forløb i 1g: Behandling af store mængder data der handler om fænomener fra samfundsfag (hvordan skaffer man sig overblik), grafisk fremstilling, deskriptiv statistik

4 (histogram, sumkurve, middelværdi, kvartilsæt, boksplot. Desuden skjulte variable, population, stikprøve repræsentativitet, systematiske fejl. Og følgende emner kunne behandles i et senere undervisningsforløb i 2g: Vurdering af et givet datamateriale, gennemføre hypotesetest, formulere konklusioner i et klart sprog. Opstille hypoteser, formulere nulhypotese, chi-i anden test på krydstabulerede kategorispørgsmål, vurdering af p-værdi og teststørrelse, konklusion i forhold til nulhypotesen Omstændighederne (de klasser vi havde) gjorde at deltagerne blev: En 1g SA klasse fra Egedal (31 elever) og et 1g SA hold (15 elever i papegøjeklasse) fra Mariagerfjord. Alle 1g-elever på de to skoler blev opfordret til at besvare spørgeskemaet (svarprocent Egedal 78% (170 svar), Mariager 62% (122 svar)). De indsamlede data blev samlet til et datasæt og behandlet på de to skoler i et samarbejde mellem SA og Ma. Undersøgelsen Udarbejdelse af spørgsmål På baggrund af den læste teori om unge i senmoderniteten opstillede lærer og elever nogle fagligt relevante spørgsmålskategorier 1. Socialisation rammerne for svarpersonens liv indtil nu 2. Identitet hvordan ser svarpersonen sig selv nu og især i fremtiden 3. Familie den primære familie og den sekundære familie (herunder traditioner i familien) 4. Det senmoderne samfund informationsteknologi, rejser, arenaer (fritidsaktiviteter) 5. Baggrundsspørgsmål alder, køn, skole, forældres arbejde, Eleverne udarbejdede efterfølgende gruppevis nogle konkrete spørgsmål, indenfor hver kategori, 5 spørgsmål pr. kategori.til hjælp fik de undervisning i, hvad et godt spørgsmål er.

5 Eleverne på de to skoler så hinandens forslag til såvel emner som spørgsmål og udøvede gensidig kritik. De endelige spørgsmålsformuleringer blev efterfølgendebesluttet af lærerne pr. telefon. Under arbejdet talte vi om, hvad en hypotese er, og hvad fordomme er. Udarbejdelse af svarkategorier Elever og lærer udarbejdede sammen svarkategorier og vigtigheden af, at svarkategorier er udtømmende, blev slået fast. Begrebet forforståelse kom i spil.for at kunne overskue svarene opererede vi med radioknapsvar, hvilket vil sige, at derkun kunneanføres et svar på hvert spørgsmål. Svarmulighederne er lukkede. Der opereres med dels kategoriske svarmuligheder (pige, dreng) og dels numeriske svarmuligheder (6 år, 10, år,..). Dette åbner for flere muligheder for databearbejdning. Det er lettere af operere med eksakte tal end med intervaller som svarkategorier. Giver præcise og anvendelige bearbejdningsmuligheder. Oprettelse af spørgeskema Vi valgte at benytte Lectio som spørgeskema, da begge skoler benytter programmet. Ved at lade den ene lærer oprette skemaet og lægge det som global skabelon, vil den anden lærer bare kunne hente skemaet og tilrette det sin skole. Spørgsmålene er således de samme på begge skoler. Se hvordan Undersøgelsens gennemførsel Spørgeskemaet skulle besvares af samtlige 1.g er. For at sikre så høj svarprocent som muligt inddrog vi klassernes samfundsfagslærere, ligesom eleverne selv præsenterede deres undersøgelse på en morgensamling. Erfaringen viste, at dette alene ikke sikrede en høj svarprocent, så det gode råd må lyde på mere opsøgende arbejde i forhold til respondenterne f.eks. ved konkrete besøg i de deltagende klasser med forudgående varsel om at medbringe computer. Begge skoler gemte svarene i en matrix, og lectio-svarene fra de to skoler blev kopieret sammen

6 Eleverne krydstabuleredesvaret på, hvilken skole man gik på med de andre svar et ad gangen for at skaffe sig overblik over, hvor der var umiddelbart synlige forskelle Vi anvendte Excels muligheder for at lave krydstabulering og pivotdiagrammer (hvor svarene omregnes til procent). Se hvordan Eleverne forsøgte at forklare nogle af forskellene ved at se på svarene i andre spørgsmål herunder om der er nogle skjulte variable eksempler. Se et eksempel Eleverne lavede histogrammer, udregnede median og middeltal for de spørgsmål, hvor der var kvantitative svar på spørgsmålenef.eks. spørgsmålet om, hvornår man fik sin første mobiltelefon. Svarene på dette spørgsmål var svære at overskue, især fordi svarene blev sorteret alfabetisk således at år kom før 4-8 år. Egedal Gymnasium og HF Egedal 0% Gymnasium 10% 20% og HF 30% 40% 50% 60% Mariagerfjord 70% 80% 90% 100% år år år (Tom) Hvor gammel var du da du fik din første mobiltelefon? Vi omregnede derfor tallene til procent for hver skole, udregnede de kumulerede frekvenser, lavede en sumkurve, aflæste kvartilsættet og lavede et boksplot.

7 Mariagerfjord Gymnasium Egedal Gymnasium og hf Hvornår fik du din første mobiltelefon? Selve beregningerne foregik i Excel, og boksplottet blev tegnet med WordMat. Men man kunne have anvendt andre beregningsprogrammer eller have regnet det hele i hånden og derefter tegnet boksplottene på papir. Tilknyttede skriftlige opgaver Opgave i samfundsfag I samfundsfag var der tale om elevernes 1. skriftlige opgave: 1) Redegør kort for 3 af de karakteristiske træk ved det senmoderne samfund (du vælger selv hvilke) Dette vil sige: Find de karakteristiske træk ved senmoderniteten, du vil arbejde med. Forklar hvad de går ud på, og hvad de skyldes. 2) Påvis ud fra tabeller og figurer fra vores spørgeskemaundersøgelse, om 1g er på Egedal og Mariagerfjord Gymnasium besidder disse træk. Dette vil sige: Opstil relevante tabeller og diagrammer, og forklar hvad de viser for hvert af de 3 valgte karakteristiske træk Konkludér om forskelle/ ligheder er tydelige (hvorfor, hvorfor ikke). Opgave i matematik

8 Nogle af jer har arbejdet med en større spørgeskemaundersøgelse i samfundsfag, hvor elever på Egedal Gymnasium og Mariagerfjord Gymnasium blandt andet svarede på, hvor mange timer de bruger på henholdsvis arbejde og motion, og hvor gamle de var, da de fik deres første mobiltelefon. o Sammenlign resultaterne fra de to skoler ved hjælp af de statistiske begreber og grafiske fremstillinger, vi har talt om. o Kommenter på resultaterne. Begge dele skal indgå i jeres besvarelse. o Desuden skal hver gruppe lave en planche til ophængning. Muligheder for at arbejde videre med materialet Det er oplagt at anvende datamaterialet i et forløb om statistiske test senere. Man kan anvende χ2-test til at undersøge, om nogle af de konstaterede sammenhænge er så store, at man må gå ud fra, at der er forskel på eleverne fra de to skoler, eller om de bare er udtryk for statistisk tilfældighed. Som eksempel ses på spørgsmålet om, hvorvidt religion og traditioner spiller en stor rolle for svarpersonens familie. Først formuleres nulhypotesen - der er ingen forskel på betydningen af religion/traditioner for eleverne fra de to skoler Dernæst den alternative hypotese - der er forskel på, hvor meget religion/traditioner betyder for eleverne på de to skoler. Vi vil nu undersøge sandsynligheden for at se den forskel, vi så eller en større forskel, hvis nulhypotesen er sand.først udregnes χ 2 -teststørrelsen som et mål for den observerede forskel. Dernæst udregnes sandsynligheden for denne teststørrelse den såkaldte p-værdi. Se her hvordan: optælling foretaget af Excel - pivottabel Antal af Hvad betyder religion/traditioner hjemme hos dig? Hvad betyder religion/traditioner hjemme hos dig? Hvilket Gymnasium går du på? Ikke noget særligt Intet Lidt, men vi fejrer religiøse helligdage Meget Hovedtotal Egedal Gymnasium og HF Mariagerfjord

9 Hovedtotal ovenstående data kopieret og indsat med menupunktet - sæt ind indsæt værdier - observerede værdier Hvilket Gymnasium går du på? Ikke noget særligt Intet Lidt, men vi fejrer religiøse helligdage Meget Hovedtotal Egedal Gymnasium og HF Mariagerfjord Hovedtotal forventede værdier beregnet ud fra observerede værdier Hvilket Gymnasium går du på? Ikke noget særligt Intet Lidt, men vi fejrer religiøse helligdage Meget Hovedtotal Egedal Gymnasium og HF 52, , , , Mariagerfjord 36, , , , Hovedtotal p-værdien 0, P-værdien er sandsynligheden for få den forskel som de observerede værdier viser eller en større forskel, hvis nulhypotesen er sand.(målet for, hvor troværdig 0-hypotesen er). I de fleste tilfælde vil man acceptere nulhypotesen og forkaste den alternative hypotese, hvis p-værdien er mere end 0,05 eller 5 %. Dette kaldes signifikansniveauet, og er sandsynligheden for at forkaste en sand nulhypotese.

10 Statistik: Historier og eksempler Helle Hvitved Dette er et forsøg på at give en overordnet beskrivelse af statistik og statistiske begreber uden at gå for meget i matematiske detaljer. Derved vil der selvfølgelig mangle nogle ting, og det vil ikke blive helt præcist på alle punkter, men det er heller ikke meningen, at man skal blive ekspert i statistiske tests ud fra dette dokument. Dokumentet er ment som et supplement for lærere, der gerne vil have nogle historier at fortælle eleverne udover det, der står i lærebogen. Introduktion til statistik generelt. Forskellige statistiske tests Signifikansniveau P-værdien 2 forskellige typer fejl Side 10 Side 12 Side 13 Side 13 Side 14 Resume af begreber Side 15 EKSEMPLERksempler 2 -test(chi-i-anden test), der er pensum i matematik og samfundsfag og anvendes en del i biologi, side 16. Her vises ingen eksempler på selve udregningerne. Andre typer sets. Eksempler, der viser, hvor 2 -testen ikke kan anvendes. Det kan med fordel læses, inden eleverne selv skal ud at finde data til 2 - testen, så man ved, hvad de ikke skal vælge. Figurer fra analyser specielt for samfundsfag. Det er en type analyser, man kan bruge i SRP Side 16 Side 16 Side 23 Side 26 Figurer fra videnskabelige artikler specielt for biologer. Biologiske data præsenteret i videnskabelige artikler. Det er resultater, som man måske kan møde i en SRP, som bilag til eksamen med 24 timers forberedelse, eller blive præsenteret for, hvis man hører et foredrag af en forsker. Side 27 Gennemregninger af eksemplerne med Ti-Interactive, TiNspire og Excel Side 31 Introduktion til statistik generelt. Vi mennesker har en indbygget trang til at kategorisere ting og udtale sig herom, f.eks. om økologisk mad er sundere end uøkologisk, om det var koldere i gamle dage, om kvinder er bedre til at multitaske end mænd, om man får større muskler, hvis man spiser et bestemt kosttilskud osv. I andre tilfælde kan det være vigtigt at finde f.eks. en type stof, der optræder i forskellig mængde hos syge og raske eller hos dopede og ikke-dopede mennesker eller at finde forskelle mellem folk med forskellig social/kulturel baggrund. I dagligdagen er det de færreste ting, man er helt sikker på. Deterministisk betyder, at man er 100% sikker på, at noget sker. Det er karakteristisk for fysikkens love. F.eks. er vi 100% sikre på, at æblet falder ned fra træet og ikke op. Indtil videre er vi også 100% sikre på, at et fødende menneske er en

11 kvinde, og vi er 100% sikre på, at hun ikke føder en elefant, men vi er ikke 100% sikre på, at babyen er et velskabt barn. Når der nu er så mange ting i verden, som man ikke er 100% sikker på, så må vi jo nøjes med lidt mindre, og så sætte nogle retningslinjer for, hvornår vi bærer os ad med at vælge f.eks. om noget er bedre/anderledes end andet. Statistik er netop det redskab, der skal hjælpe os til at beslutte, om der er hold i et udsagn af ovennævnte typer eller hjælpe os til at afgøre, om man f.eks. kan adskille syge/raske eller dopede/ikke-dopede på baggrund af et bestemt stof. Det første problem er at finde ud af, hvordan man måler det, man vil udtale sig om. Det vil vi ikke beskæftige os med lige her. Næste problem er at finde ud af, hvem eller hvad vi snakker om. Det kaldes populationen. Vi kan vælge økologiske gulerødder, temperaturer de sidste 200 år, kvinder og mænd mellem 20 og 60 år, 1. og 2. generations indvandrere fra bestemte lande, osv. Det, vi vælger at måle på kaldes en variabel. Vi kan se på køn (mand-kvinde), dyrkningsmetode (økologisk-traditionel), religion (protestant, muslim, andet), vælgere (blå-rød blok), stofmængde af et bestemt kemisk stof (målt i mg) eller højde (målt i meter), indkomst (kr. eller dollar). De første fire variable kaldes kategoriske og de tre sidste kaldes numeriske. Indenfor denne population har vi så vores forestilling om en sammenhæng, og vi skal have denne sammenhæng formuleret som en hypotese eller rettere 2 hypoteser, idet vi skal bruge en alternativ hypotese, hvis vi ender med ikke at tro på vores udgangshypotese. Nu er det sådan, at det er lettere at regne med ligheder end med uligheder, for hvis to ting er ens, så er forskellen 0, men hvis de ikke er ens, hvad er forskellen så? 1? 1,5? 7? 133? Med kategoriske variable taler vi om uafhængighed i stedet for lighed, så her har vi med bestemte forholdstal, som vi så kan regne på. Statistik er sådan bygget op, at vores hovedhypotese, der kaldes nul-hypotesen, er den, hvor der er lighedstegn eller uafhængighed, og den alternative hypotese er den, hvor der er forskel eller afhængighed og så er det i første omgang ligegyldigt, hvor stor den forskel er. Det er tit sådan, at man faktisk ønsker, at forkaste hypotesen om lighed og godtage den alternative hypotese om ulighed. Medicinalfirma A vil frygtelig gerne vise, at deres medicin er bedre en firma B s. Kvinderne vil gerne vise, at de er bedre til at multitaske en mænd, man vil gerne vise at arbejdsløsheden falder/stiger osv. Nulhypotesen siger, at hvis man ser en forskel, så skyldes det rene tilfældigheder, mens den alternative hypotese påstår, at forskellen skyldes en underliggende årsag, f.eks. køn eller økologisk dyrkning eller den siddende regerings politik. Nu skal vi så i gang med at måle på vores variable og lave nogle statistiske beregninger. Vi kan ikke måle alt. Hvis vi f.eks. måler vitaminindhold i alle verdens gulerødder, så er der jo ikke nogen tilbage at spise, og det vil tage for lang tid og være for dyrt. Derfor er vi nødt til at tage en stikprøve, som er et mindre og overkommeligt antal objekter. Hvordan disse udvælges, og hvor mange, der udvælges skal ikke behandles her.

12 Forskellige statistiske tests For at få en overskuelig fornemmelse af, hvad der findes af statistiske tests, der er relevante for gymnasiet, laves følgende oversigt: Enkelt variabel Kategorisk data Kategorisk data stammer fra undersøgelser, hvor man grupperer sine objekter i forskellige kategorier og tæller antallet i hver gruppe. Det kan f.eks. være en spørgeskemaundersøgelser med lukkede spørgsmål, hvor man kun kan sætte flueben, eller forsøg hvor man tæller objekter:. Hver variabel inddeles i et antal kategorier (svarmuligheder), og hvert individ eller objekt tæller 1 i hver kategori, f.eks. 1 kvinde, 1 rødhåret, 1 elev på mata, 1 ryger, 1 arbejdsløs, 1 grøn og rund ært. Når der kun er 1 variabel, kan man sammenligne antallet i kategorierne med en teoretisk eller tidligere funden fordeling. Det kan dreje sig om en bestemt genetisk fordeling, eller det kan være en opinionsundersøgelse, der sammenlignes med sidste valg. Testen kaldes Goodness of fit (GOF) og er en variant af 2 -testen. Numerisk data Numerisk data er f.eks. højde, vægt, indkomst. Man kan teste om pigernes menstruationscyklus nu også er 28 dage (uden P-piller), eller om fundne skeletter fra pestens tid har samme gennemsnitshøjde som moderne mennesker. Her bruges t-test. En variation af denne test er en parvis t-test, hvor man har de samme individer/objekter før og efter en hændelse, eller har individer/objekter, der er parrede på en eller anden måde. Her har man 1 variabel, der er forskellen på de målte værdier i parret. Det kunne være forskellen i kondi før/efter en bestemt træningsmetode eller forskellen i indtægt mellem ægtefæller. Dobbelt variabel Kategorisk data Kategorisk data Man kan se på 2 variable samtidig og se, om der er en sammenhæng eller afhængighed imellem dem, f.eks. mellem køn og rygning, rygning og kræft, mellem forældres socialklasse og børns uddannelse, mellem regioner og socialklasser osv. Man sætter data op i en krydstabel og tester for uafhængighed af de to variable. Her anvendes en 2 -test. Kategorisk data Numerisk data Her vil vi nøjes med at se på tilfælde med 2 kategorier, f.eks. mænd/kvinder, matematikere/samfundsfaglige, trænede/utrænede og så kan man sammenligne højde, vægt, BMI, fraværsprocent, karakterer, testscores, blodprocent. Hertil anvendes t-test. Fodnote: Vær opmærksom på, at parret t-test hører til under 1 variabel, se ovenfor. Numerisk data Numerisk data 2 variable kan tegnes ind i et plot, og man kan lave en regression, f.eks. en lineær regression. Eleverne kender R 2, der giver et mål for, hvor meget punkterne spreder sig om linjen. Man kan så teste, om denne linje tyder på, at y-værdierne er uafhængige eller ukorrelerede med x- værdierne, så linjen er vandret, eller om man tværtimod kan se en stigende eller en faldende tendens. Har anvendes enten en t-test eller en F-test, men de er stort set de samme, idet F = t 2. Eksemplerne nedenfor er kodede i de forskellige farver.

13 For hver af disse situationer er der konstrueret en eller flere testmetoder, der resulterer i en teststørrelse, der er et tal. Hvordan denne teststørrelse beregnes, skal ikke behandles her. Fælles for alle teststørrelser er, at de er beregnet ud fra hypotesen om samme gennemsnit, ingen tidsmæssige ændringer op eller ned eller uafhængighed. Her har vi jo netop et tal at regne med (forskellen 0, hældningen 0 eller samme forholdsmæssige fordeling i kategorier). Vores stikprøve vil ikke have forskellen/ændringen præcis 0, for verden er ikke deterministisk. Der er variationer, og det vil der også være indenfor vores stikprøve. Teststørrelsen regner ud, hvor meget vores stikprøve varierer fra den ideelle verden, hvor vores hypotese gælder 100%. Alle teststørrelserne er sådan indrettet, at jo længere vi kommer fra en forudbestemt værdi, jo længere ligger vi fra hypotesens ideelle verden, og jo mindre troværdig bliver hypotesen. Opgaven er så at finde ud af, hvornår teststørrelsen passerer en grænse, hvor vi siger, at nu tror vi ikke længere på den hypotese, som vi har brugt til at udregne teststørrelsen. Signifikansniveau Man kan illustrere ideen bag denne grænse med følgende eksempel: Hvis man slår med en terning ved man, at der teoretisk er sandsynligheden 1/6 for en sekser og sandsynligheden 5/6 for en ikkesekser, hvis man har en ægte terning. Det er så vores hypotese. Man kan så tælle, hvor længe der går, før man får en sekser (hvor man er slået hjem i Ludo, og de andre ræser rundt på banen mod mål). De første par slag uden en sekser accepterer man som uheld, men hvis der bliver ved med ikke at komme seksere, vil man begynde at undre sig og undersøge terningen. Der må være nogen, der har pillet ved terningen. Man kan beregne sandsynligheden for, at man stadig ikke har fået en sekser, men tallet når aldrig ned på 0%, for der er altid en lillebitte chance for, at det alligevel kan ske. Statistik går ud på at finde en grænse, hvor man siger, nu tror vi ikke på hypotesen længere. Vi skal vælge den sandsynlighed, hvor vi siger, at godt nok er hændelsen mulig, men den er så usandsynlig, at vi hellere vil tro på den alternative hypotese. Traditionelt vælger man 5%, og det betyder i eksemplet med terningen, at efter 17 slag uden en sekser stopper vi spillet og mistænker vores modspiller for at spille med falsk terning (udregnet side 31). Vi siger, at resultatet afviger signifikant fra det forventede, og vi anvender her et signifikansniveau på 5%. I f.eks. medicinalindustrien, hvor man vil være meget sikre på sine resultater, anvender man ofte 1% som signifikansniveau. Ideen i eksemplet er, at man med statistik fastsætter den grænse, hvor man skifter fra at tro på hypotesen til at tro på alternativet. Antal slag uden en sekser er den simpleste teststørrelse, der findes, og den magiske grænse 17 kalder vi den kritiske værdi for denne teststørrelse. De teststørrelser, der er nævnt ovenfor, behandles med sandsynlighedsregning, og man finder så nogle kritiske værdier, der angiver grænsen ved et hvilket som helst fastsat signifikansniveau. Vi vil kun interessere os for 5% signifikans og 1% signifikans, men alligevel bliver der hurtigt en masse forskellige teststørrelser, kritiske værdier og signifikansniveauer at holde styr på. Før computerne blev almindelige, havde man tabeller, som man måtte slå op i for at finde den kritiske værdi, der svarede præcis til den test og det antal ting/individer/hændelser, som man havde målt på. P-værdien Med de moderne computere vil man oftest bruge en enkelt værdi, der har den samme betydning, uanset hvilken undersøgelse man har udført. Dette kaldes p-værdien. P-værdien har den fordel, at når først den er regnet rigtigt ud, så er det bedøvende ligegyldigt for læseren, hvilken test der er udført, om det er en af de fem typer ovenfor eller en helt sjette type.

14 P-værdien måler nul-hypotesens troværdighed, og den angiver sandsynligheden for at få en teststørrelse, der er længere ude, dvs. mindre sandsynlig end den man har fået givet at nulhypotesen er sand. Vi sammenligner nu bare p-værdien med signifikansniveauet 5% eller 1%, alt efter, hvilken vi har valgt. Hvis p-værdien er større end 5%, så er nul-hypotesen troværdig, og vi accepterer den, fordi vi er ikke så langt ude. Omvendt, hvis p-værdien er mindre end 5%, så er vi langt ude, og nul-hypotesen er ikke længere troværdig, og vi vælger den alternative hypotese. I praksis ser man f.eks. ofte P-værdier af størrelsen p< 0,0001, og så er vores test meget signifikant, og vi vælger alternativet. Andre gange kan p-værdien ligge og rode lige under 5%, og så er testen ikke så overbevisende. Hvis vi f.eks. lader alle skolens elever slå med en ægte terning, indtil de får en sekser, og de hver især skal rapportere, hvor mange slag, det tager, så skal man regne med, at ca. hver tyvende elev (=5%) bruger 17 slag eller mere. 2 forskellige typer fejl Vi accepterer altså en 5% fejl, hvor vi forkaster hypotesen, selv om den er sand. Det kaldes type I fejl. Samtidig har vi også mulighed for at lave en fejl, hvor vi ikke forkaster hypotesen, hvis den nu vitterlig er forkert. Dette kaldes type II fejl. Hvis man gør sandsynligheden for den første fejl lille, ved at mindske signifikansniveauet, så bliver sandsynligheden for den anden fejl større. Man kan sammenligne med en helt anden situation fra det virkelige liv: Hvis man skal diagnosticere en slem sygdom, vil man selvfølgelig gerne have de raske bedømt raske og de syge bedømt syge, så de kan behandles. Men der er altid risiko for, at nogle af de syge bliver bedømt raske, så de ikke får behandling, og nogle af de raske bliver bedømt syge, så de bliver forskrækkede og unødigt bliver behandlet. Man skal her gøre sig klart, at mange undersøgelser har en gråzone, hvor det er svært at vurdere, hvorvidt prøven er positiv eller negativ. Et andet eksempel er en anklaget i en retssag, der dømmes skyldig eller frikendes alt efter hvilken vægt man lægger på bevismaterialet: Testen viser rask Testen viser syg Patienten er Rask OK Ubehagelig fejl Patienten er syg Katastrofal fejl OK (men trist) Den anklagede frikendes Den anklagede dømmes Den anklagede er uskyldig OK justitsmord Den anklagede er skyldig..ærgerligt for ordensmagten OK Vi accepterer 0-hypotesen Vi forkaster 0-hypotesen 0-hypotese er sand OK Type 1 fejl 0-hypotesen er falsk Type 2 fejl OK Hvis man er meget bange for at lave en type 1 fejl, så tør man næsten ikke forkaste nul-hypotesen, men så bliver det ekstra svært nogensinde at ende med at vælge den alternative. Historisk har man brugt signifikansniveauet (=sandsynligheden for type 1 fejl) af størrelsen 5% eller 1%, og det er jo den, der definerer grænsen for troværdigheden af nul-hypotesen. Det er meget vigtigt, at man har

15 besluttet sig for sit signifikansniveau, inden man begynder at lave sin undersøgelse, for man må ikke lade resultaterne påvirke sit valg. Hollywood-setup: du bor i Japan, og der er lovet jordskælv og oversvømmelser sidst på dagen og mobilnettet er brudt sammen. Der er busser, der skal evakuere området, og du vil gerne vente på din kæreste, for du tror på, at han/hun er i området endnu (din nul-hypotese). I får lov at lede til kl. 16:00, så kører bussen, for projektet er at redde så mange som muligt, og der er jo den mulighed, at kæresten har taget en anden bus (den alternative hypotese). Der er to udfald: I kører med kæresten eller I kører uden kæresten. Det giver 2 mulige katastrofer: I kører uden kæresten, og kæresten dør, fordi han/hun vitterlig var i området, eller 45 mennesker dør, fordi I blev for længe for at lede efter en, der allerede var kørt væk, og derfor blev I indhentet af vandmasserne. De to gode udfald er, at I finder kæresten og kører inden kl. 16:00, eller at I kører og finder kæresten i den anden ende, hvor han/hun forhåbentlig har været bekymret for dig. En vigtig pointe her er, at en eller anden har taget den beslutning, at kl. 16:00 er absolut sidste kørselstidspunkt. Sættes det tidligere, mindskes chancen for at finde kæresten, mens der er større chance for at redde bussen. Flyttes tidspunktet til senere, øges chancen for at finde kæresten, mens chancen for at redde bussen falder. Det svarer præcis til at vælge et signifikansniveau. Statistik kan bruges, når vi har et projekt, der går ud på at kunne præsentere et resultat, en overskrift, en konklusion: Der gælder sådan og sådan, eller vi skal gøre sådan og sådan. Vi opstiller en hypotese og et alternativ, og vi beslutter os for et signifikansniveau, der fastsætter den grænse, hvor vi tipper fra hypotesen til alternativet. Så følger dataindsamling og udregninger, og til sidst står vi med en P-værdi, der skal sammenlignes med det valgte signifikansniveau: Hvis p er mindre end det valgte tal, forkaster vi hypotesen og vælger alternativet, hvis P er større end det valgte signifikansniveau, holder vi os til hypotesen. Resume af begreber Hypotese: Nul-hypotesen og den alternative hypotese to skal udtrykke den sammenhæng, som man ønsker at undersøge. Nul-hypotesen skal udtrykke, at eventuelle forskelle i resultater kun skyldes tilfældigheder, og alternativet skal så udtrykke, at forskellene har en retning. Nul-hypotesen vil indeholde ord som uafhængig af, lig med, ændringen over tid er 0, hvor alternativet lyder afhængig af, forskellig fra, stigende eller faldende over tid. Signifikansniveau Signifikansniveauet er den maksimale sandsynligheden for at forkaste hypotesen, hvis den er sand. Man bruger ofte værdien 0,05 eller 0,01. Det betyder, at man prisgiver de 5% eller 1% af resultaterne, der er for langt ude i forhold til nul-hypotesen, for i stedet at tro på den alternative hypotese. P-værdi Når man har fået nogle resultater, benytter man nul-hypotesen til at finde sandsynligheden for at få et resultat, der er længere væk fra uafhængighed/nul/vandret linje end den fundne stikprøve er. Denne sandsynlighed sammenligner man med signifikansniveauet og forkaster hypotesen, hvis P er mindre end signifikansniveauet og beholder hypotesen, hvis P er større.

16 EKSEMPLER Her følger et antal eksempler, hvor udregningerne ikke er medtaget i første omgang. Her er kun P- værdier og konklusioner, og pointen med at læse dem er, at se en masse eksempler på tests, uden at skulle tage stilling til, hvordan de er lavet. Af praktiske grunde er eksemplerne delt i chi-i-anden, der er pensum, og de andre tests, der ikke er pensum, men som man måske alligevel kan få brug for. 2 test (kategoriske data med 1 eller 2 variable) Eksempel 1 En gruppe biologielever vil undersøge, hvor følsomme læberne er, ved at teste, om nogle forsøgspersoner kan føle forskel på 1 pril og 2 prik, de sidste med først 1 mm afstand og senere 2 mm afstand (10 af hver): Hypotese: Svarene er helt tilfældige (personen kan ikke føle forskel og gætter bare på et tal). Alternativ hypotese: personen kan føle forskel på 1 og 2 prik. Sted: læbe Mm:1 Stik med Lis 1 2 sum svar et to sum P= 0,6531 > 0,05 Hypotesen forkastes ikke, så forsøgspersonen har gættet Sted: læbe Mm:2 Stik med Lis 1 2 sum svar et to sum P=0,0246 < 0,05 (Udregnet side 31) Hypotesen forkastes, og der er en overvægt af rigtige svar (7 og 8 mod 2 og 3). Sted: læbe Stik med Bo Mm:1 1 2 sum svar et to sum P= 0,1775 > 0,05 Hypotesen forkastes ikke, så forsøgspersonen har gættet Sted: læbe Stik med Bo Mm:3 1 2 sum svar et to sum P=0 Vi behøver slet ikke at teste dette klokkeklare resultat. Her har vi 2 variable: stikket og svaret, og fire kategorier: 1stik svar et, 1 stik svar to, 2 stik svar et og 2 stik svar to.

17 Eksempel 2 En gruppe samfundsfagselever vil undersøge forældres holdning til 16 års valgret og til alkohol ved skolefester. (Udregnet side 33). 16- års valgret Køn For Imod I alt Fædre Mødre I alt Alkohol til gymnasiefester Køn For Imod I alt Fædre Mødre I alt Chi2-test p-værdi 0,0120 Chi2-test p-værdi 0,5346 Hypotese: Holdning til hos gymnasieelevers forældre er uafhængig af køn Alternativ hypotese: Holdning til hos gymnasieelevers forældre er afhængig af køn Konklusion: Holdningen til 16-års valgret er forskellig hos fædre og mødre til gymnasieelever, mens holdningen til alkohol er ens. Vi har igen to variable, køn og standpunkt med fire kategorier: far for, far imod, mor for og mor imod. Bemærk, at vi ikke tester noget om selve holdningen til spørgsmålet. Det er altså ligegyldigt, hvor mange der er for og imod. Det vi tester er, om fædre og mødre stemmer på samme måde. Eksempel 3 En biologiklasse har sået byg med 2 genetiske varianter: grøn/hvid og høj/lav. De sår 90 frø, hvoraf de 87 spirer. Hypotese: Plantevarianterne udspaltes i forholdet 9 : 3 : 3 : 1 Alternativ: Plantevarianterne udspaltes ikke i forholdet 9 : 3 : 3 : 1 Denne gang håber vi på, at hypotesen bliver bevaret, da det er vores teori. (Udregnet side 33) Høje og grønne Høje og hvide Små og grønne Små og hvide sum Obs Forventet 48,94 16,31 16,31 5,43 P = 0,365. Konklusion: Hypotesen kan ikke forkaste, så ærterne følger den forventede fordeling. Her er formålet ikke at teste uafhængighed mellem de to variable. I stedet kigger vi på de forskellige fænotyper, så vi får fire sideordnede kategorier, og vi tester for en bestemt teoretisk, forholdsmæssig fordeling i kategorierne. Denne type 2 test kaldes Goodness of fit. Eksempel 4 Bliver man forkølet af at være kold? Videnskab.dk, 9. december personer deles i to grupper, hvor af den ene gruppe sidder med fødderne i koldt vand og den anden sidder med fødderne i en tom balje. Det giver igen 2x2 kategorier. Hypotese: forkølelse er uafhængig af føddernes temperatur Alternativ: forkølelse er afhængig af føddernes temperatur Tallene i parentes er de forventede værdier, hvis hypotesen er sand, og for overskuelighedens skyld er store afvigelser farvet enten røde eller blå. Dette er en rent subjektiv farvemetode, men den kan gøre det lettere at lave en konklusion: kolde fødder kontrol forkølet 13 (9) 5 (9)

18 Ikke forkølet 77 (81) 85 (81) Sum P = 0,047 Da p < 0,05, bliver hypotesen forkastet, så forkølelse er afhængig af føddernes temperatur. Det ses af tabellen, at kolde fødder giver mere forkølelse, men det er ikke et overbevisende resultat. Eksempel 5 En klasse har AT om evolution. De laver forsøg med selektion i forhold til farve, og det gør de ved at samle bønner i 3 farver op fra et papir, der har samme farve som den ene slags bønner. Teorien er, at de bedst tilpassede overlever, og den bedst tilpassede her må være dem, der ligner baggrunden mest. Hypotese: overlevelse er uafhængig af farve Alternativ: overlevelse er afhængig af farven i forhold til baggrundsfarven. Her ses klassens resultater for hvidt karton: Hvidt karton Bønne hvid brun rød I alt Observeret : spist 21 (48) 51 (48) 72 (48) 144 ikke-spist 379 (352) 349 (352) 328 (352) 1056 P < 0,0001 Hypotesen forkastes. Der er altså en selektion, og det ses af resultaterne, at på hvidt karton er det de hvide, der bedst overlever. Eksempel 6 Vold mod unge i Danmark, SFI Hypotese: vold mod børn er uafhængig af forældres og børnenes køn Alternativ: vold mod børn er afhængig af forældres og børnenes køn Vold begået af Mor Far Piger Drenge P = 0,96 > 0,05, så hypotesen forkastes ikke. Konklusion: Mor og far er lige slemme til at slå, og de slår lige meget på drenge og piger. Eksempel 7 I en sexlivsundersøgelse fra 2009 af mænd, der alle har været sammen med en mandlig partner, spørger man om HIV status, bopæl, og prævention. Nedenfor er vist 3 tabeller, hvor hypotesen i de

19 to første tabeller er, at HIV-status er uafhængig af hhv. bopæl og beskyttelse, og i den tredje tabel er, at beskyttelse er uafhængig af alder. Tabel 1 HIV + HIV - ukendt 434 København 74 (58) Odense, Århus, Ålborg 10 (20) Udenfor store byer 17 (22) (449) 65 (66) 168 (156) 21 (23) 174 (171) 28 (25) P = 0, (Udregnet side 34) Tabel 2 sikker sex usikker sex Tabel 3 sikker sex usikker sex HIV + 38 (69) 70 (39) < 30 år 275 (198) 136 (213) HIV (569) 246 (328) (264) 222 (284) ukendt 39 (90) 103 (52) > (254) 411 (272) P = 5,03798E- 33 P = 4,81337E-51 Konklusion: Første tabel viser en overrepræsentation af HIV+ mænd i København. Tabel 2 viser, at mænd, der er testet HIV er mest tilbøjelige til at dyrke sikker sex, set i forhold til mænd, der er testet HIV+ og mænd, der ikke er testet. Tabel 3 viser, at det især er mænd over 50 år, der sløser med den sikre sex. Alle tre resultater er statistisk signifikante, da P < 0,05. Eksempel 8 Mænd er så kloge - synes de selv Søndag den 14. november 2010 I en Gallupundersøgelse, Berlingske Tidende har fået lavet, svarer 54 procent af de danske mænd, at de er mere intelligente end de fleste andre. 35 procent af kvinderne svarer det samme. Klogere end de fleste Ikke klogere end de fleste Mænd 56 (45) 48 (59) Kvinder 48 (59) 89 (78) Hypotese: Mænd og kvinder har samme vurdering af sig selv Her fås en p-værdi på 0,0035, så der er forskel på mænds og kvinders vurdering af sig selv. Men er det nu mændene, der synes, at de er så kloge? Kunne det ikke lige så godt være kvinderne, der undervurderer sig selv? (Diskuter spørgsmålets formulering: klogere end de fleste og evt. også medianens betydning her). Eksempel 9 Mænd har mere ferie end kvinder, Newsdesk tic.travel, 17/01/2011 (hotels.com) Mens kun knap hver tredje kvinde (32 pct.) kan nyde 6 ugers ferie eller mere, gælder dette for næsten hver anden mand (44 pct.).

20 Der er 705 kvinder og 448 mænd i undersøgelsen (oplyst af hotels.com). Kvinder Mænd Hypotese: mænd og kvinder har samme 5 ugers ferie 176 (165) 117 (128) ferielængde. Denne hypotese kan ikke 6 ugers ferie 226 (237) 197 (186) forkastes på 5% niveau, men den kan godt P = 0,078 forkastes på 10% niveau, og 10% kan være godt nok til en markedsføringsstrategi. 6 pct. af de danske mænd har således ferie mere end 12 uger om året. Dette gælder kun 3 pct. af kvinderne. Kvinder Mænd De små procenter og den store forskel på < 12 ugers ferie 378 (372) 285 (291) 12 uger 24 (30) 29 (23) P = 0,098 antallet af adspurgte mænd og kvinder betyder, at resultatet kun med nød og næppe er signifikant på 10% niveau. Den interessante forskel ligger i ansættelser med og uden aftaler om ferie (tal oplyst af hotels.com): Kvinder Mænd Hypotese: mænd og kvinder fordeler sig ligeligt job med ferie 402 (438) 314 (278) på jobs med og uden ferie-aftaler. Den udenfor feriesystemet 303 (267) 134 (170) forkastes overbevisende. Det ses af tabellen at flest mænd har job med ferie-aftaler. P < 0,001 Eksempel 10 Unge muslimer råhygger uden alkohol videnskab.dk 19. november 2010 Man har undersøgt unge muslimers og unge danskeres alkoholvaner. Fra undersøgelsen har vi blandt andet: Har aldrig Har drukket Muslimer drukket alkohol alkohol mænd 21 (27,7) 34 (27,3) 55 kvinder 41 (34,3) 27 (33,7) P = 0,0124 (Udregnet side 34) Har aldrig Har drukket Protestanter drukket alkohol alkohol mænd 15 (14,1) 861 (861,9) 876 kvinder 16 (16,9) 1029 (1028,1) P = 0,75

21 Hypotesen er, at der ikke er forskel på mænds og kvinders alkoholvaner blandt hhv. muslimer og protestsanter. Konklusionen er, at der er forskel på unge muslimske mænd og kvinders forsøg med alkohol, mens de unge danskere ikke adskiller sig på køn. Eksempel 11 Placeboeffekt, BioNyt nr. 151, februar 2011 Placebo anvendes ofte i studier af medicin, hvor man lader halvdelen af forsøgsdeltagerne få medicinen og den anden halvdel få placebo, der ikke indeholder noget virksomt stof. I det følgende studium har man derimod undersøgt selve effekten af placebo ved at lade halvdelen af forsøgsdeltagerne få placebo, som de ved er placebo, mens den anden halvdel intet får. Placebo Intet sum Bedring Uændret P = 0, Hypotese: ingen effekt af placebo Konklusion: P < 0,05, så der er påvist en effekt af placebo. Se dog artiklen, hvor der er opremset en del indvendinger mod forsøget. Eksempel 12 Flere kvinder blev gravide efter klovnebesøg, Videnskab.dk, På fertilitetsklinikker har man det problem, at selv om man overfører befrugtede æg til kvinden, så er det ikke sikkert, at de sætter sig fast i livmoderen. En klinik prøvede at lade en klovn besøge kvinderne lige efter at ægget blev sat op. Det forbedrede chancen for graviditet: ikkegravid gravid sum klovn 40 (31) 70 (79) 110 ikke-klovn 22 (31) 87 (78) 109 sum Hypotese: klovnene gør ingen forskel, Alternativ: Klovnene gør en forskel. P = 0,007873, så hypotesen forkastes. Det ses, at klovnene forbedrer sandsynligheden for at bliver gravid. Effekten er formodentlig, at kvinderne slapper af. Der forlyder ikke noget om, om der er forskel på han-klovne og hun-klovne. Eksempel 13 Sammenligning af to prognoser fra Altinget.dk. Megafon fra med 1022 adspurgte og Voxmeter fra med 2011 adspurgte.

22 V K O LA S SF R EL Megafon Voxmeter Hypotese: Prognosen er uafhængigt af analyseinstituttet. P = 0,080, så hypotesen forkastes ikke. De forskellige institutter får ikke forskellige resultater. Eksempel 14 Skolebørnsundersøgelsen denne undersøgelse er en guldgrube af mulige tests, da man har været meget omhyggelig med at skrive, hvor mange personer, der indgår i hver undersøgelse. Undersøgelsen omfatter over 4000 elever i et repræsentativt udsnit af 11-, 13- og 15 elever i landet. Den gennemføres i 41 lande. De variable er køn, alder og socialgrupper, og af den sidste er følgende antal repræsenteret: Socialgruppe I II III IV V VI antal Der er stillet mange spørgsmål og her er valgt et: Socialgruppe I II III IV V VI Er ude med venner mindst 3 aftener om ugen ikke ovenstående P Hypotese: der er ikke forskel på 11-, 13- og 15-åriges adfærd i de 6 socialgrupper. P = 0,000056, så hypotesen forkastes.

23 Andre typer tests: ( numerisk og kategorisk variabel) Eksempel 15 (binomial test eller parvis t-test) Samfundsfagsklassen undersøger forældrene alder. De mente, at fædre er ældre end mødre, men hypotesen skal have lighed, så: Hypotese: Fædre og mødre har samme alder Alternativ: Fædre og mødre har ikke samme alder Fars alder 41, 47, 47, 45, 42, 47, 45, 46, 53, 50, 50, 47, 53, 48, 48, 47, 48, 47, 53, 50, 49, 60, 47, 57, 48 Mors alder 40, 45, 40, 42, 51, 43, 45, 44, 47, 49, 46, 47, 57, 51, 45, 42, 50, 43, 52, 49, 45, 54, 43, 56, 48 Der er i alt 25 forældrepar. 20 hvor far er ældst, og 5 hvor mor er ældst (jeg har spurgt nærmere ind til de jævnaldrende). Hvis vi kun tager hensyn til ældre/yngre laves en binomialtest, hvor P = 0,002. Tager man også hensyn til aldersforskellens størrelse, laves parvis t-test, hvor P = 0,029, så hypotesen forkastes i begge tilfælde, og forældrene har ikke samme alder, og det ses af tabellen, at far er ældst. (Gennemregnet side Fejl! Bogmærke er ikke defineret.). Eksempel 16 (t-test) Eleverne i en biologiklasse laver farve-konflikttest. De skal læse farverne på ord, f.eks. læses GRØN som rød. Det siges, at pigerne er bedre til det end drenge, men vores hypotese er, at drenge og piger er lige gode, og alternativet er, at der er forskel. Antal Tid, sec. Gennemsnit Piger 16 42, 60, 60, 56, 89, 59, 51, 70, 56, 68, 46, 60, 69, 59, 48, sec Drenge 8 45, 56, 75, 75, 70, 68, 65, sec Resultaterne er mildest talt modsat det, der siges, men vi kan jo godt teste hypotesen alligevel, for måske er drengene hurtigst. Vi laver t-test og får P = 0,18. Vi kan altså ikke forkaste hypotesen, så der er ingen forskel på drenges og pigers evner i denne opgave. (Udregnet side 37) Eksempel 17 (t-test) Samf-klassen er træt af at høre, at lærerne roser mat-fys elevernes fremmøde og kritiserer samfelevernes pjækkeri, så de får deres matematiklærer til at finde fraværsprocenterne i de to klasser. Matematiklæreren sorterer procenterne, så de bliver mere anonyme: samf 0,45 1,61 5,6 6,48 6,72 8,71 9,11 9,66 11,5 12,19 12,4 13,09 14,34 14,4 17,46 17,68 17,82 18,15 18,57 20,76 22,31 22,49 22,54 22,69 Mafy 0 0,22 4,71 4,87 5,33 7,69 7,69 7,76 7,93 8,62 10,02 10,49 10,96 11, ,67 12,82 15,23 15,38 15,49 15,76 16,25 17,45 18,41 Samfernes hypotese er, at der ikke er forskel på klassernes fraværsprocent, og de får da også P = 0,0654, selv om middelfraværet er 13,6% i samf-klassen og 10,4% i mat-fys-klassen. Men hypotesen bliver altså ikke forkastet, så lærerne må holde op med at hakke på den stakkels samfklasse, synes de. Mat-fys erne påpeger, at data ikke er normalfordelte i de to grupper. Derfor laver de en simulering af data, hvor de blander tallene 2032 gange og finder 77 tilfælde, hvor samfklassen har højere fravær end den fundne. Det giver P = 0,0379. (Udregnet side 37)

24 Hov, siger samf erne, I ser jo kun på det tilfælde, hvor vi har højere fravær end jer. Det kaldes en ensidig test. Vi ser også på det tilfælde, hvor jeres fravær er højest. Det er en to-sidig test. Så er det da ikke mærkeligt, at vores test giver en P-værdi, der er dobbelt så stor som jeres. (Se en gennemgang af en- og to-sidige tests under beregninger, side 34). Eksempel 18 (test for lineær regression) Vi har i mange år sagt, at der bliver født flere drengebørn end pigebørn. Gamle statistikbøger bruger tallene 52% drenge og 48% piger. Fra diverse statistiske årbøger kan vi finde procentdelen af drenge fra Der laves lineær regression, og R 2 = 0,16. Det er ikke en imponerende R 2. Vi laver en test: Hypotese: Procentdelen af drengebørn er uændret i perioden Alternativ: Procentdelen af drengebørn har ændret sig i perioden P = 0,0024, så vi forkaster altså hypotesen, og ser på figuren, at procentdelen er faldende. Så selv om punkterne er meget spredt, så er der er et signifikant fald.

25 Eksempel 19 (test for lineær regression) En samfundsfagsklasse har undersøgt antallet af domme for butikstyveri blandt årige i perioden (fra Statistikbanken) år Hypotese: antal domme er uændret. Alternativ hypotese: der er en systematisk ændring over årene. P = 0,0019 < 0,05, så hypotesen forkastes, og der er en tendens, og den ses at være en faldende. Eksempel 20 (test for lineær regression) En samfundsklassen har undersøgt antal unge mænd sigtet for spritkørsel i Danmark i perioden (fra Statistikbanken). De beslutter at dele data i to perioder: og , hvor de lader de to perioder overlappe med 2 år. Bagefter skal klassen undersøge, hvad der skete i , der ændrede billedet. Hypotese: tendenslinien i perioden er vandret, dvs. ændringen i antal domme er tilfældig spredning Alternativ: tendenslinien er ikke vandret, så der er en stigende eller faldende tendens. De 6 forskellige tests er skrevet op i en tabel: Mænd år P = 0,033 P < 0,001 Mænd år P = 0,003 P = 0,02 (Udregnet side 39) Mænd år P< 0,001 P = 0,62 Konklusion: Der er et tydeligt fald i antal spritdomme for mænd mellem 20 og 29 år i årene For unge mellem 15 og 19 er der kun et svagt fald i samme periode. I perioden er antal spritdomme for mænd mellem 25 og 29 stabil, mens de helt unge ifølge grafen har en tydelig stigning. Det er ikke fordi stigningen er så stor, men den tilfældige variation er meget lille, så punkterne ligger tæt på en ret linie med en lille stigning. Mændene mellem 20 og 24 viser en stigning, men det havde nok set anderledes ud, hvis eleverne havde valg at starte den anden periode i 1999 i stedet for Eleverne går så i gang med at finde ud af, om der er sket noget specielt i , der har påvirket spritdommen. Det havde her været mere korrekt at tilpasse en parabel i stedet for en ret linje. Eksempel 21 (test for lineær regression) Medlemmerne flygter fra de konservative, Jyllands-Posten 12.marts Nul-hypotese: vælgersvingningerne er udtryk for tilfældigheder Alternativ hypotese: der er en trend År Årefter2005 medlemmer

26 P = 0, (Udregnet side Fejl! Bogmærke er ikke defineret.) Konklusion: P < 0,05 så der er en trend, der ses at være faldende medlemstal. Eksempel 22 (test for lineær regression) Milliardindsats på usikkert grundlag, Jyllands-Posten 14.april Vandmiljøplanen bygger på en formodning om, at en nedsættelse af kvælstofudledningen fra markerne vil give forbedrede tilstandene i vandmiljøet. Udbredelsen af ålegræs er valgt som succeskriterium, idet man ved, at denne plante vokser bedst og på størst dybde, hvis vandet er rent og klart og har et lavt indhold af kvælstof. Nedenstående kurver viser hhv. kvælstofindholdet (mmol/l) og maximale vanddybde med ålegræs (m) ved Skive. Det ser ud som om at kvælstofmængden falder, mens udbredelsen af ålegræs ikke ændrer sig og den burde jo være steget. Hvis vores nul-hypotese er ingen ændring gennem årene, får vi p = 0,00002 for kvælstof og p = 0,57 for ålegræs. Så vores formodning holdt stik: kvælstofmængden er faldet signifikant, mens ålegræsdybden ikke har ændret sig signifikant. Fra 1988 til 2008 er faldet i kvælstof ret præcist 50%, hvis man bruger en lineær model (R 2 = 0,62). Tallene bygger på aflæsning fra avisens kurve det burde selvfølgelig være alle målte værdier: N-konc Ål-dyb 2,05 1,5 1,25 1,55 1,05 1,25 1,35 2 1, ,5 1,45 1,6 1,1 1,4 1,9 2,05 2 1,2 Figurer fra analyser specielt for samfundsfag Eksempel 23 Strukturreformen udfordrer nærdemokratiet Krevi 26. jun 2009 Man ser på hhv sammenlagte kommuner og på kommuner, der er blevet sammenlagt. Man har så spurgt til borgernes tillid til kommunen i 2001 og Hypotesen er, at tilliden er uafhængig af kommunesammenlægningen. Vi ved ikke, hvilken analysemetode, der er blevet anvendt, men P- værdien burde give mening:

27 Konklusionen er, at borgerne har mistet tillid til kommunerne, der er sammenlagt. Selvtilliden opfører sig på samme måde, men resultatet er knap så markant. Eksempel 24 Brugeres og borgeres præferencer for kommunale serviceydelser Krevi Danskerne vil ikke betale hvad som helst for at få forbedret en hvilken som helst kommunal serviceydelse. Og der er store forskelle i betalingsviljer mellem forskellige befolkningsgrupper. Det viser KREVIs undersøgelse af danskeres præferencer for kommunale serviceydelser. Deltagerne i undersøgelsen er blevet stillet forskellige spørgsmål, der skal vise, hvor mange kr. de er villige til at betale pr. husstand pr. år. for nogle ydelser. KREVI fortæller, at der er lavet nogle helt specielle analyser af spørgeskemaerne, og det kræver nogle meget avancerede statistiske metoder. Vi må nøjes med at se på P-værdierne. Hypoteserne er, at folk ikke vil betale for mere service. De tilfælde hvor P > 0, er specielt nævnt under figuren. Der er beløbet ikke signifikant forskel fra 0, så det er selvfølgelig de meget lave søjler. N er antal svarpersoner, og det kan variere fra spørgsmål til spørgsmål. Desuden er der lavet diverse sammenligninger, hvoraf der her er et resume hentet på hjemmesiden: Undersøgelsen viser klare forskelle mellem befolkningsgrupper: Venstreorienterede vil typisk betale mere end højreorienterede for serviceforbedringer. Kvinder vil typisk betale mere end mænd. Brugere vil betale mere end ikke-brugere. Jo tættere, vi kommer på pensionsalderen, des mere vil vi betale for praktisk hjælp til ældre. Sjællændere vil betale mere for økologi i frokostordninger og for at få hentet deres storskrald og haveaffald end jyder vil. Figurer fra videnskabelige artikler specielt for biologer Her følger en kort gennemgang af, hvorledes data kan blive fremstillet grafisk i en popularvidenskabelig artikel, uden at man egentlig behøver at nævne de udførte tests. Der gives også en nem tommelfingerregel, der kan bruges, når man ser på de publicerede figurer, men som ikke må bruges som test, da den ikke er helt nøjagtig. Eksempel 25 Bakterier renser drikkevand, A k t u e l N a t u r v i d e n s k a b Man undersøger, om bakterier (Aminobacter) fjerner stoffet BAM fra drikkevandet. Der bliver selvfølgelig lavet en masse små delforsøg, altså glas med bakterier og glas uden bakterier. Efter 20 timer, 30 timer og 40 timer måler man så mængden af BAM ( g/l) i hvert af de mange glas. Man udregner gennemsnittet af glassene uden bakterier og gennemsnittene af glassene med bakterier, og desuden beregner man spredningen. Spredningen divideres med kvadratrod n, og hedder nu Fejl! Henvisningskilde ikke fundet.. Der er her lavet 3 t-test til tre forskellige tidspunkter.

28 Gennemsnittene afsættes med en figur, her små kvadrater, og standardfejlen tegnes lodret op og ned, evt. afsluttet med en vandret streg. Den lodrette streg er altså 2 standardfejl lang. (2 er meget tæt på de 1,96, som du måske kender fra normalfordelingen). De rå tal kan se sådan her ud for målingerne ved 20 timer: Ved 20 timer BAM (ug/l) kommentar uden bakterier 1,573; 1,552; 1,489; 1,633;.osv Gennemsnit af alle tallene er ca. 1,6 med bakterier 0,431; 0,397; 0,411; 0,405;.osv Gennemsnit af alle tallene er ca. 0,4 Man laver en t-test, hvor hypotesen er, at mængden af BAM er ens med og uden bakterier efter 20 timer. Her vil man få P<0,001, og man forkaster hypotesen. Det gør man for alle tre tidspunkter, og konklusionen er så, at bakterierne fjerner BAM fra drikkevandet. Der er en øjemålsregel her, som siger, at hvis de lodrette streger fra standardfejlene når hinanden, så forkaster man IKKE hypotesen, og hvis de lodrette streger ikke når hinanden, så forkaster man, og der er forskel på gennemsnittene. I dette eksempel ligger gennemsnittene og stregerne langt fra hinanden, og det passer med artiklens konklusion. Eksempel 26 Når stress er sundt, A k t u e l N a t u r v i d e n s k a b Når mange bananfluelarver vokser op på et lille område (høj tæthed), så får de signifikant højere levetid (livslængde): Vi ser to søjler med forskellig højde, og vi ser nogle meget små standardfejl, der dog kun er tegnet opad, men man kan selv forestille sig, at man tegner dem symmetrisk på søjlens overligger, og at man skubber søjlerne sammen, så de ligger oveni hinanden. De to standardfejl vil så aldrig kunne nå i nærheden af hinanden, så de to livslængder for hhv. lav og høj tæthed er altså signifikant forskellig. Der er lavet en t-test.

29 Eksempel 27 Indavl og undergang, A k t u e l N a t u r v i d e n s k a b Planter, der er meget sjældne og kun findes i små spredte grupper, bliver let indavlede. Man har fundet to grupper af planten stenbræk, og så har man prøvet at krydsbestøve dem. Man undersøger frugtbarheden (spiringsprocenten) hos de indavlede (røde) og de krydsede (blå) planter. Der erlavet 7 t-tests, en for hver af de målte dage. Artiklen konkluderer, at de krydsede planter har signifikant større spiringsprocent end de oprindelige, og det passer med, at de lodrette standardfejl ikke overlapper. HUSK: dette med at se på overlappende lodrette streger er ikke tilstrækkeligt, hvis man selv laver undersøgelsen og har ansvaret for resultaterne, men den er fortrinlig, hvis man bare er tilskuer, og ser på andre folks artikler og skal have et overblik.

30 EKSEMPEL 28 Vin og kvinder, Aktuel Naturvidenskab Man mener, at knoglerne bliver mere skøre hos mennesker, der drikker meget alkohol, men denne her figur viser IKKE en klar sammenhæng, da standardfejlene overlapper eller næsten overlapper.. Artiklen foreslår da også, at man skal forske noget mere i denne sammenhæng. Der er lavet en test, hvor man kan sammenligne 4 variable. Eksempel 29 Kvinder smækker røret på for at undgå indavl, Videnskab.dk, 7. december 2010 Far bliver frosset ud, og mor bliver forfremmet til personlig rådgiver, når kvinder er mest frugtbare. Det sker ubevidst, men det forhindrer indavl. Studiet går ud på at se, om unge kvinder omkring ægløsningstidspunktet, hvor de er mest fertile, prøver at undgå deres far. Man har valgt at se på telefoni, og ser på længden af samtaler med henholdsvis fædre og mødre. Fra hver kvinde ser man på, hvor længe hun snakker med sin mor, når hun ikke har ægløsning (low fertility), og hvor længe hun snakker med mor, når hun har ægløsning (high fertility), hvor længe hun snakker med far, når hun ikke har ægløsning (low fertility), og hvor længe hun snakker med far, når hun har ægløsning (high fertility). Man har spurgt 48 unge kvinder, og beregnet gennemsnittet og standardfejlene af de 4 grupper af tal. De hypoteser der undersøges, er, at længden af samtalerne er ens, ligegyldigt hvilke to grupper tal vi sammenligner. På figuren ses til venstre, at kvinderne i gennemsnit snakker med mor i 3 minutter og med far i 2,1 minut ved lav fertilitet. Linjerne for standardfejlene støder sammen, så vi gætter på, at der ikke er nogen signifikant forskel på de to slags samtaler. Artiklen oplyser, at hvis der laves t-test, fås netop P > 0,05 (forkast ikke hypotesen). Kigger vi i stedet på samtaler omkring ægløsning, så ser vi, at kvinderne snakker 3,5 minut med mor og 1 minut med far, og de lodrette streger mødes ikke. Det passer med, at hvis vi laver en test her, får vi P < 0,001 (forkast). Så konklusionen er, at der i høj grad er forskel på samtaler med fædre og mødre omkring ægløsning, og den forskel ses ikke udenfor ægløsningstidspunktet. Sammenligner vi i stedet samtalerne med mor under og udenfor ægløsning, så ser man, at de lodrette streger ville overlappe, hvis man skubbede dem hen til hinanden, hvorimod de tilsvarende streger for far ikke ville overlappe, hvis de blev skubbet sammen. Hvis man tester forskellen mellem 3 og 3,5 minutter for mor, får man P > 0,05, så forskellen på 3 og 3,5 er altså ikke signifikant. Tester man derimod taletiden med fædre (2,1 ved lav fertilitet mod 1,0 ved høj fertilitet), så får man P < 0,05. Så den samlede konklusion på alle testene er, at samtaletiden med far under ægløsning er signifikant forskellig fra de andre forældresamtaler, der stort set er ens.

31 Eksempel 30 (det er eksempel 16 i ny forklædning) Farvekonflikttest Her er resultaterne tegnet med gennemsnit og standardfejlene. Bemærk at standardfejlene næsten kunne rører hinanden, hvis søjlerne blev skubbet sammen. Der blev heller ikke fundet nogen statistisk forskel mellem drenge og piger. Gennemregninger af eksemplerne Eksemplet med terningeslag: Sandsynligheden for 16 ikke-seksere i træk er (5/6) 16 = 0,054 Sandsynligheden for 17 ikke-seksere i træk er (5/6) 17 = 0,045 Sandsynligheden for 25 ikke-seksere i træk er (5/6) 25 = 0,0105 Sandsynligheden for 26 ikke-seksere i træk er (5/6) 26 =0,0087 Så bruger man 5% er 17 den magiske grænse = den kritiske værdi, og bruger man 1%, er 26 grænsen. Men det er vigtigt at påpege, at man ALDRIG viser noget ved bare 1 forsøg. Eksempel 1 Observeret værdi Stik med Lis 1 2 sum svar sum De forventede værdier beregnes som f.eks. Rækkesum*søjlesum = 10*9 = 4,5 total 20 Forventet Stik med værdi 1 2 sum svar 1 4,5 5, ,5 5,5 10 sum En 2x2 tabel siges at have 1 frihedsgrad (df = degrees of freedom). Det skyldes, at når man vil beholde rækkesummerne 10 og 10 samt søjlesummerne 9 og 11, så kan man kun vælge 1 af tallene i tabellen frit. Havde vi f.eks. fået 6 i stedet for 7 i kategorien 1 stik svar 1, så ville vi automatisk få 4, 3 og 7 i de andre kategorier. 2 -testen bygger på, at række- og søjlesummer holdes konstant, når vi skal undersøge, om vi er langt ude. Ti-Interactive. Først Insert Matrix to gange: og TI-nspire: ok

32

33 Eksempel 2 Observeret 16- års valgret Forventet Køn For Imod I alt Fædre ,5 10,5 Mødre ,5 10,5 I alt *33 = 16,5, og 27*21 =10, ,4 Excel Eksempel 3 (togenskrydsning) Høje og grønne Høje og hvide Små og grønne Små og hvide sum Obs Forventet 48,94 16,31 16,31 5,43 Her sammenligner vi en række observerede tal med en række teoretiske tal, som er 87*9/16, 87*3/16, 87*3/16 og 87/16. Der er 3 frihedsgrader, da det fjerde tal skal sørge for, at summen bliver 87. Ti-nspire: OK Excel Brug Indsæt funktion og vælger Chi-test. Marker både de observerede og de forventede, så får man P = 0,365.

34 Eksempel 7 Observerede værdier: HIV + HIV - ukendt I alt København Odense, Århus, Ålborg Udenfor store byer I alt Forventede værdier: De forventede værdier beregnes således: 573*101 = 58, 573*776 =449, 219*776 = 171, 219*114 = Ti-nspire: OK Eksempel 10 Mænd Har aldrig drukket alkohol Har drukket alkohol Ingen religiøs baggrund 3 (11) 369 (361) 372 Protestant 15 (26) 861 (850) 876 Muslim 21 (1,6) 34 (53) Vi kan ikke teste denne interessante tabel, fordi den ene forventede værdi (i parentes) er mindre end 5, og vi må kun lave en Chi-i-anden-test, hvis alle de forventede værdier er mindst 5. Hvorfor må vi ikke lave chi-i-anden-test, når den forventede værdi er mindre end 5? Chi-i-anden teststørrelsen fås ved at beregne (observeret forventet) 2 /forventet for hver eneste celle og så lægge dem sammen. Der er meget stor forskel på at dividere med 1 eller med 2, f.eks (6-1) 2 /1 = 25 mens (6-2) 2 /2 = 8. Hvis der derimod er 11 og 12 i nævneren (som er den forventede værid), så er (16-11) 2 /11 = 2,27 mens (16-12) 2 /12 = 1,33, så her er forskellen ikke så stor, selv om forskellen mellem de to nævnere stadig er 1. Ud fra erfaring er man så kommet til, at det giver brugelige resultater, bare de forventede værdier er større end 5.

35 Eksempel 15 (binomial test eller parvis t-test) (Er fædre ældre end mødre?) Man har fædrenes alder i en søjle og mødrenes i en anden søjle. Ti-Interactive Udregn L3 = L1 L2, dvs man ser kun på aldersforskellen. Så vælger man Stat test and interval tool og t-test, og sætter = 0, dvs at man ser, om aldersforskellen er 0. Her har man farvet den del af fordelingskurven, der har værdier numerisk større end det observerede. Det farvede areal er 3% af arealet under kurven, da p = 0,03. TI-nspire Vælg man Lister og regneark og udregner forskel = far mor. Dvs at man kun ser på forskellen. Vælg t-test og 0 = 0 samt 0. (Tabellen fortsætter i søjle far og mor).

36 Excel: Her vælger man Data og derpå Dataanalyse og så t-test: Parvis dobbelt stikprøve for middelværdi, og sætter Hypotese for forskel i middelværdi = 0 Far Mor Middelværdi 48,6 46,96 Varians 17, ,95667 Observationer Pearson-korrelation 0, Hypotese for forskel i middelværdi 0 fg 24 t-stat 2, P(T<=t) en-halet 0, t-kritisk en-halet 1, P(T<=t) to-halet 0, t-kritisk to-halet 2, Vi ser, at selv om aldersforskellen på fædre og mødre i gennemsnit kun er 1,6 år (48,6 46,96), så forkaster vi hypotesen, fordi vi jo ser på forældrene parvis. Binomialtest: Ti-Interactive TI-nspire Excel n er antal adspurgte, sandsynlighed er 0,5 (50-50 for hvem der er ældst), og k = 5 er den mindste af de to observerede værdier

37 Eksempel 16 (farvekonflikttest) Her har vi ikke parvis test, så man vælger som følger: Ti-Interactive: Her har man farvet den del af fordelingskurven, der har værdier numerisk større end det observerede. Det farvede areal er 18% af arealet under kurven, da p = 0,18. TI-nspire Excel Vælg t-test med 2-prøver. Udfyldes som Ti-Interactive, men vælg NEJ ud for Samlet ( fordi drenge og piger er i hver sin kolonne). Vælg t-test: to stikprøver med ens varians. Resten er som parvis t-test. Eksempel 17 (fravær i mat-fys klasse og samf klasse) Simulering af fordelinger kan kun lade sig gøre i TI-nspire. Ideen bag simuleringen er, at hvis nulhypotesen er sand, så værdierne (her fraværsprocenterne) er tilfældigt fordelt, så kan man tage de fundne værdier (data) og blande dem og fordele dem tilfældigt på eleverne i klassen. Så er det fundne resultat bare et af mange, og man kan studere, hvordan resultatet ligger i forhold til alle de andre mulige udfald. TI-nspire Bjørn Feldsager har beskrevet metoden i sine t-test noter, og man kan se metoden animeret her i del 1 og del 2. Data skrives i regneark i to søjler: søjle A er fag, så en matfys elev hedder mf, og en samfelev hedder sa. Søjle B er fravær og søjle C laver omrøring i fraværstallene. Søjle D og E piller det observerede fravær for mat og samf ud i hver sin søjle, mens F og G gør det samme for de omrørte tal. Søjle C,F og G ændrer sig, hver gang man laver en ny omrøring. Her ses søjlehovederne, hvor søjle C er skrevet ud for sig: Søjle H bruges til nogle enkeltstående udregninger. Først beregnes forskellen i gennemsnitsfravær hos matfys ere og samf ere, dels i de observerede tal, dels i den omrørte (simulerede) tal. Det andet tal ændrer sig altså for hver omrøring: I H2 og H4 skal vi højreklikket og vælge variable -> gem var. For at gemme en observation fra hver omrøring laves en ny variabel i søjle I:

38 Vi skal også tælle antal omrøringer og antal tilfælde, hvor samf erne har endnu større fravær i forhold til mat-fys erne, end det observerede (forskellen bliver så et numerisk større negativt tal): Og så udregnes den simulerede P fra de to ovenstående: Hold Ctrl + R nede, indtil dim_test har en passende størrelse. Lav en ny side eller gå under sidelauout og vælg 2-delt side. Klik og vælg data og statistik. Klik på x-aksen og vælg variablen Test. Under Analyser sælges Plot værdi. Vælg variablen obs_dif, der er den observerede forskel. Bemærk, at man så kun tæller til venstre for den afsatte linie (ensidig), hvor man på figuren i eksemplet ovenfor, har farvet halerne i begge side af fordelingen (tosidig Ensidig og tosidig test I de numeriske tests, hvor man sammenligner målte værdier, har man hypoteser, der kan formuleres med lighedstegn og alternativer, der formuleres med forskellig fra. Her er der så mulighed for at lave alternativ med formuleringen mindre end eller større end. F.eks. har en lineær regression en faldende tendens en linje med negativ hældning - altså hældning mindre end 0. Mange fordelinger er symmetriske, som vi ser på figuren lånt fra eksempel 14 og som vi også kan se på den simulerede fordeling i eksempel 15. Så der er lige så mange procent, der er for langt ude til højre, som der er til venstre. Det vil sige, at hvis vi skifter fra en tosidig test til en ensidig test, så falder P-værdien til det halve. Det betyder, at hvis man har P < 0,05 i en tosidig test, så gælder det også for en ensidig test, og man forkaster hypotesen. Hvis P > 0,10, så er den ensidige p større end 0,05, og man vil ikke forkaste. Kun hvis P-værdien for den tosidige test ligger mellem 0,05 og 0,10, vil P for den ensidige test ligge under 0,05. Så der får man forskellig konklusion, og hvis man der har valgt en ensidig test, så vil man uvægerlig blive kritiseret for sit valg. Situationen opstod i eksempel 17, hvor det eneste argument for ensidig test er, at der er da ingen der regner med, at mat-fys erne pjækker mere end samf erne. Derfor laver man en nulhypotese, hvor for meget mat-fys fravær kommer sammen med lige meget fravær, og det tester man mod samf ernes fravær i den alternative hypotese. Selvfølgelig bliver samf erne vrede over det! Man skal beslutte sig for, hvilken side man vil teste til, inden man overhovedet laver testen. Ved simuleringen kommer man nok let til at teste ensidigt i den side, hvor man nu lige er endt. Eksempel 9 vil man også kunne teste ensidigt, hvis man ikke kunne drømme om, at kvinder kunne tænkes at have længst ferie.

39 Eksempel 18 (drengebørn) Excel Regressionsstatistik Multipel R 0, R-kvadreret 0, Justeret R- kvadreret 0, Standardfejl 0, Observationer 54 ANAVA fg SK MK F Signifikans F Regression 1 0, , , , = P Residual 52 1, ,03077 I alt 53 1,91292 Koefficienter Standardfejl t-stat P-værdi Nedre 95% Øvre 95% Skæring 60, , ,6096 1,11E-26 54, ,72113 X-variabel 1-0, , , , , ,00176 Se på de farvede tal: 0,016 kender vi som R 2 fra regressionen. Vores hypotese siger, at hældningen a = 0, og med en signifikans på P = 0,0024 forkaster vi denne hypotese. Vi ser også, at skæring med y-aksen = b = 70,4 og hældningen = a = -5,63, og a ligger med 95% sikkerhed mellem - 0,0077 og -0, Eksempel 20 (Spritdomme) Ti-Interactive TI-nspire Vælg Lineær reg t-test. Vælg x og y søjler. Excel Data, dataanalyse, regression. Vælg y- og x-værdier (i den rækkefølge) RESUMEOUTPUT Mænd Regressionsstatistik Multipel R 0, R-kvadreret 0, Justeret R- kvadreret 0, Standardfejl 41,813 Observationer 9 ANAVA

40 fg SK MK F Signifikans F Regression , ,2 6,9525 0, Residual , ,327 I alt ,56 Koefficiente r Standardfejl t-stat P-værdi Nedre 95% Øvre 95% Skæring 421, , ,4091 7,61E , ,481 X-variabel 1-14,2333 5, , , , ,4690 Se på de farvede tal: 0,49 kender vi som R 2 fra regressionen. Vores hypotese siger, at hældningen a = 0, og med en signifikans på P = 0,0336 forkaster vi denne hypotese. Vi ser også, at skæring med y-aksen = b = 422 og hældningen = a = -14,2, og a ligger med 95% sikkerhed mellem -27 og -1,45.

41 Eksempel 21 (Medlemmer til det konservative folkeparti) TI-nspire Vælg Lineær reg t-test. Vælg x og y søjler. Excel bruger F-test og TI-nspire bruger t-test. Forskellen er bare, at F = t 2, og da det indgår i de videre beregninger, ender man med, at P-værdierne er præcis ens. t 2 = (-11,6048) 2 = 134,6 P = 0, Excel Data, dataanalyse, regression. Vælg y- og x-værdier (i den rækkefølge) RESUMEOUTPUT Regressionsstatistik Multipel R 0, R-kvadreret 0, Justeret R- kvadreret 0, Standardfejl 374,0659 Observationer 6 ANAVA fg SK MK F Signifikans F Regression ,6708 0, Residual , ,3 I alt

42 Eksempel 25 Standardfejl eller spredningen på gennemsnittet: Når vi har en stikprøve med n observationer, kan vi beregne gennemsnit, varians og spredning, som er kvadratroden af variansen. Gennemsnit fra forskellige stikprøver ligger tættere på hinanden end de oprindelige observationer, og man kan vise, at spredningen på gennemsnittene er stikprøvens spredning divideret med kvadratrod n, altså. Gennemsnit er tilnærmelsesvis normalfordelt, så man ved at ca. 95% af alle gennemsnit skal ligge indenfor gennemsnit ± 2 standardfejl. Så hvis man skal sammenligne to gennemsnit, kan man stå i den ene værdi og se, om den anden ligger indenfor 2 standardfejls afstand. Eller man kan se, om man mødes, hvis man starter i hvert sit gennemsnit og går en standardfejl mod hinanden. Det forudsætter selvfølgelig, at de to standardfejl er nogenlunde lige store. Hvis man ser lidt stort på nøjagtighederne her, så kan man lave en øjemålsregel, der kan bruges, når man læser en artikel eller hører et foredrag med Powerpoint. Her kan man gå ud fra, at forfatteren eller foredragsholderen har styr på den nøjagtige statistik, og man skal som læser eller tilskuer kun danne sig et overblik over resultaterne. Se eksempel Øjemålsregel: Hvis man skal sammenligne to værdier og har hypotesen, at gennemsnittene er ens, så sammenligner man bare de lodrette streger, der viser standardfejlene. Hvis stregerne når hinanden eller overlapper, så forkaster man IKKE hypotesen, og hvis streger IKKE når hinanden, så forkaster man hypotesen, og der er så forskel på gennemsnittene.

43 2 -test med kendte sandsynligheder Eksempel 1: Mendels forsøg Georg Mendel offentliggjorde resultaterne af sine eksperimenter om nedarvning af bønneplanters fænotype i planter blev undersøgt og inddelt efter deres form rynkede/runde og grønne/gule. Type Antal Runde, gule 315 Runde, grønne 108 Rynkede, gule 101 Rynkede, grønne 32 Ifølge Mendels teori skulle disse fænotyper forekomme i forholdet 9 : 3 : 3 : 1, eftersom de to fænotyper forventes at være uafhængige og fordi begge fænotyper udviser dominans gul dominerer over grøn og rund dominerer over rynkede. Ifølge Mendels model skulle de forventede sandsynligheder for de fire grupper være: Ho: p ru,gu =9/16 p ru,gr =3/16 p ry,gu =3/16 p ry,gr =1/16 Hvis vi antager, at Mendels teori er sand (altså tror på ovenstående fordeling), så vil vi forvente, at 556 5/6=312,75 planter ud af 556 vil have runde og gule bønner. Hvis vi laver de samme beregninger for de andre grupper så kan vi opstille følgende tabel Type Obs. Forventet Runde, gule ,75 Runde, grønne ,25 Rynkede, gule ,25 Rynkede, grønne 32 34,75 Heraf ses, at det observerede antal og det antal vi forventer at se, hvis Ho-hypotesen er sand, er meget tæt på hinanden. Vi vil teste om hypotesen er sand ved hjælp af X 2 -testen. X 2 -værdien udregnes til X 2 = = 0,47 Vi sammenligner denne værdi med en X 2 (3) fordeling, fordi vi jo har fire kategorier og dermed 3 frihedsgrader. Den kritiske værdi for en X 2 (3) fordeling, når vi tester med et signifikansniveau på 0,05, er 7,81. Eftersom X 2 = 0,47 er mindre end 7,81 så kan vi ikke forkaste nulhypotesen. Tilsvarende er P = 0,92 > 0,05, så vi forkaster ikke hypotesen. Med andre ord, så strider disse date ikke med Mendels hypotese. TI-nspire Se fremgangsmåden i næste eksempel. Eksempel 2: Togenskryds (laboratorieøvelse) Brug bestrålede frø med varianterne hvid/grøn og høj/lav. Der følger vejledning med frøene. Her tester vi de 4 fænotyper mod den teoretisk, forholdsmæssig fordeling i de 4 kategorierne. Denne type 2 test kaldes Goodness of fit. Hypotese: Plantevarianterne udspaltes i forholdet 9 : 3 : 3 : 1

44 Alternativ: Plantevarianterne udspaltes ikke i forholdet 9 : 3 : 3 : 1 Vi håber på, at hypotesen bliver bevaret, da det er vores teori. Eksempel på resultat: Høje og grønne Høje og hvide Små og grønne Små og hvide sum Obs Forventet 48,94 16,31 16,31 5,43 87 Her sammenligner vi en række observerede tal med en række teoretiske tal, som er 87*9/16, 87*3/16, 87*3/16 og 87/16. Der er 3 frihedsgrader, da det fjerde tal skal sørge for, at summen bliver 87. P = 0,365. Konklusion: Hypotesen kan ikke forkaste, så ærterne følger den forventede fordeling. Ti-nspire: Klik og vælg Stat tests og derpå : Så får man: Excel Hvor P er beregnet ved: Eksempel 3: Togenskryds med epistasi Her benyttes f.eks. byg med grønne, gule og hvide blade (normal, xanta og albino). Der er kun 3 fænotyper, idet to af fænotyperne smelter sammen. Den teoretiske fordeling er 9 : 3 : 4, og testen laves som ovenstående bare med 3 kategorier og 2 frihedsgrader. Hypotese: udspaltningen følger 9 : 3 : 4 fordelingen (altså 9/16, 3/16 og 4/16) Her er et eksempel på en klasses resultater: Normal Xanta Albino Observeret Forventet 111,375 37,125 49, , , , , P = 0, Konklusion: Hypotesen kan ikke forkastes. Udspaltningen følger den forventede fordeling, men resultatet er ikke overbevisende. 2 -test for uafhængighed i 2x2 skema Eksempel 4: Kastrering og sukkersyge Betydningen af tidlig kastrering af mus i forhold til udvikling af sukkersyge er blevet testet på ikkeovervægtige mus. Forventningen var, at tidlig kastrering øger sandsynligheden for udvikling af sukkersyge.

45 100 mus blev tilfældigt delt i to grupper og de 50 mus i den ene gruppe blev kastreret dagen efter de blev født. 26 af de 50 kastrerede mus havde efter 112 dage udviklet sukkersyge, mens kun 12 af de ikke-kastrerede mus havde sukkersyge. Dette kan samles i en 2 x 2 tabel: Sukkersyge Ikke sukkersyge I alt Kastrerede Ikke-kastrerede Ialt Hvis vi lader p 1 og p 2 angive sandsynligheden for udvikling af sukkersyge for henholdsvis kastrerede og ikke-kastrerede, så ønsker vi at teste hypotesen H 0 : p 1 = p 2 mod H A : p 1 p 2 eller H 0 : udvikling af sukkersyge er uafhængig af om musen er kastreret H A : udvikling af sukkersyge afhænger af om musen er kastreret Vi bruger ligesom før formlen X 2 = Og får X 2 =8,3192. Dette tal svarer til X 2 med 1 frihedsgrad og får en p-værdi på 0, Da der er tale om en ensidig hypotese så skal dette tal divideres med 2 og vi får den endelige p-værdi til 0,0039. Da 0,0039 < 0,05, forkastes nulhypotesen, og vi kan konkludere, at tidlig kastrering ændrer risikoen for udvikling af sukkersyge hos normalvægtige mus, og vi kan se, at risikoen er øget. Ti-Interactive Insert matrix:. Indtast tallene.. Vælg og og TI-nspire Vælg stat test og 2 tovejs: Excel Indtast de 4 tal samt række- og søjlesummer: Beregn den første forventede værdi med formlen. Denne formel kan nu kopieres til de tre andre celler. Vælg f x = Chitest:

Fagligt samspil mellem Ma-B og SA-A Lisbeth Basballe, Mariagerfjord Gymnasium og Marianne Kesselhahn, Egedal Gymnasium og HF

Fagligt samspil mellem Ma-B og SA-A Lisbeth Basballe, Mariagerfjord Gymnasium og Marianne Kesselhahn, Egedal Gymnasium og HF Fagligt samspil mellem Ma-B og SA-A Lisbeth Basballe, Mariagerfjord Gymnasium og Marianne Kesselhahn, Egedal Gymnasium og HF Vi ønskede at planlægge og afprøve et undervisningsforløb, hvor anvendelse af

Læs mere

Statistik: Historier og eksempler Helle Hvitved

Statistik: Historier og eksempler Helle Hvitved Statistik: Historier og eksempler Helle Hvitved Dette er et forsøg på at give en overordnet beskrivelse af statistik og statistiske begreber uden at gå for meget i matematiske detaljer. Derved vil der

Læs mere

MATEMATIK A-NIVEAU. Anders Jørgensen & Mark Kddafi. Vejledende eksempler på eksamensopgaver og eksamensopgaver i matematik, 2012

MATEMATIK A-NIVEAU. Anders Jørgensen & Mark Kddafi. Vejledende eksempler på eksamensopgaver og eksamensopgaver i matematik, 2012 MATEMATIK A-NIVEAU Vejledende eksempler på eksamensopgaver og eksamensopgaver i matematik, 2012 Kapitel 4 Statistik & sandsynlighedsregning 2016 MATEMATIK A-NIVEAU Vejledende eksempler på eksamensopgaver

Læs mere

for gymnasiet og hf 2017 Karsten Juul

for gymnasiet og hf 2017 Karsten Juul for gymnasiet og hf 75 50 5 017 Karsten Juul Statistik for gymnasiet og hf 017 Karsten Juul 5/11-017 Nyeste version af dette hæfte kan downloades fra http://mat1.dk/noter.htm Hæftet må benyttes i undervisningen

Læs mere

Vejledende eksamensopgaver vedr. hypotesetest (stx B og stx A)

Vejledende eksamensopgaver vedr. hypotesetest (stx B og stx A) Vejledende eksamensopgaver vedr. hypotesetest (stx B og stx A) Opgave 1 I nedenstående tabel ses resultaterne af samtlige hjerteklapoperationer i 007-08 ved Odense Universitetshospital (OUH) sammenlignet

Læs mere

Lars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ 2 -test og Goodness of Fit test.

Lars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ 2 -test og Goodness of Fit test. Lars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ -test og Goodness of Fit test. Anvendelser af statistik Statistik er et levende og fascinerende emne, men at læse om det er alt

Læs mere

Deskriptiv statistik for matc i stx og hf

Deskriptiv statistik for matc i stx og hf Deskriptiv statistik for matc i stx og hf 75 50 25 2019 Karsten Juul Deskriptiv statistik for matc i stx og hf Hvad er deskriptiv statistik? 1.1 Hvad er deskriptiv statistik?... 1 1.2 Hvad er grupperede

Læs mere

Deskriptiv statistik for hf-matc

Deskriptiv statistik for hf-matc Deskriptiv statistik for hf-matc 75 50 25 2018 Karsten Juul Deskriptiv statistik for hf-matc Hvad er deskriptiv statistik? 1.1 Hvad er deskriptiv statistik?... 1 1.2 Hvad er grupperede og ugrupperede data?...

Læs mere

for gymnasiet og hf 2016 Karsten Juul

for gymnasiet og hf 2016 Karsten Juul for gymnasiet og hf 75 50 5 016 Karsten Juul Statistik for gymnasiet og hf Ä 016 Karsten Juul 4/1-016 Nyeste version af dette håfte kan downloades fra http://mat1.dk/noter.htm HÅftet mç benyttes i undervisningen

Læs mere

for matematik pä B-niveau i hf

for matematik pä B-niveau i hf for matematik pä B-niveau i hf 75 50 5 016 Karsten Juul GRUPPEREDE DATA 1.1 Hvad er deskriptiv statistik?...1 1. Hvad er grupperede og ugrupperede data?...1 1.1 Eksempel pä ugrupperede data...1 1. Eksempel

Læs mere

Skriftlig eksamen i samfundsfag

Skriftlig eksamen i samfundsfag OpenSamf Skriftlig eksamen i samfundsfag Indholdsfortegnelse 1. Introduktion 2. Præcise nedslag 3. Beregninger 3.1. Hvad kan absolutte tal være? 3.2. Procentvis ændring (vækst) 3.2.1 Tolkning af egne beregninger

Læs mere

Spørgeskemaundersøgelser og databehandling

Spørgeskemaundersøgelser og databehandling DASG. Nye veje i statistik og sandsynlighedsregning. side 1 af 12 Spørgeskemaundersøgelser og databehandling Disse noter er udarbejdet i forbindelse med et tværfagligt samarbejde mellem matematik og samfundsfag

Læs mere

Eksempel på besvarelse af spørgeordet Hvad kan udledes (beregn) inkl. retteark.

Eksempel på besvarelse af spørgeordet Hvad kan udledes (beregn) inkl. retteark. Eksempel på besvarelse af spørgeordet Hvad kan udledes (beregn) inkl. retteark. Denne opgavetype kan tage sig ud på forskellig vis, da det udleverede materiale enten kan være en tabel eller en figur. Nedenfor

Læs mere

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test] Anvendt Statistik Lektion 6 Kontingenstabeller χ 2- test [ki-i-anden-test] Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination af

Læs mere

Statistik II 1. Lektion. Analyse af kontingenstabeller

Statistik II 1. Lektion. Analyse af kontingenstabeller Statistik II 1. Lektion Analyse af kontingenstabeller Kursusbeskrivelse Omfang 5 kursusgange (forelæsning + opgaveregning) 5 kursusgange (mini-projekt) Emner Analyse af kontingenstabeller Logistisk regression

Læs mere

Matematik A. Studentereksamen. Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet

Matematik A. Studentereksamen. Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet Matematik A Studentereksamen Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet stx11-matn/a-080501 Tirsdag den 8. maj 01 Forberedelsesmateriale til stx A Net MATEMATIK Der

Læs mere

Statistik. Peter Sørensen: Statistik og sandsynlighed Side 1

Statistik. Peter Sørensen: Statistik og sandsynlighed Side 1 Statistik Formålet... 1 Mindsteværdi... 1 Størsteværdi... 1 Ikke grupperede observationer... 2 Median og kvartiler defineres ved ikke grupperede observationer således:... 2 Middeltal defineres ved ikke

Læs mere

Personlig stemmeafgivning

Personlig stemmeafgivning Ib Michelsen X 2 -test 1 Personlig stemmeafgivning Efter valget i 2005 1 har man udspurgt en mindre del af de deltagende, om de har stemt personligt. Man har svar fra 1131 mænd (hvoraf 54 % har stemt personligt

Læs mere

Hypotesetests, fejltyper og p-værdier

Hypotesetests, fejltyper og p-værdier Hypotesetests, fejltyper og p-værdier Søren Højsgaard Institut for Matematiske Fag, Aalborg Universitet October 25, 2018 Søren Højsgaard Institut for Matematiske Fag, Aalborg Hypotesetests, Universitet

Læs mere

Schweynoch, 2003. Se eventuelt http://www.mathematik.uni-kassel.de/~fathom/projekt.htm.

Schweynoch, 2003. Se eventuelt http://www.mathematik.uni-kassel.de/~fathom/projekt.htm. Projekt 8.5 Hypotesetest med anvendelse af t-test (Dette materiale har været anvendt som forberedelsesmateriale til den skriftlige prøve 01 for netforsøget) Indhold Indledning... 1 χ -test... Numeriske

Læs mere

for matematik pä B-niveau i hf

for matematik pä B-niveau i hf for matematik pä B-niveau i hf 014 Karsten Juul TEST 1 StikprÅver... 1 1.1 Hvad er populationen?... 1 1. Hvad er stikpråven?... 1 1.3 Systematiske fejl ved valg af stikpråven.... 1 1.4 TilfÇldige fejl

Læs mere

Mikro-kursus i statistik 1. del. 24-11-2002 Mikrokursus i biostatistik 1

Mikro-kursus i statistik 1. del. 24-11-2002 Mikrokursus i biostatistik 1 Mikro-kursus i statistik 1. del 24-11-2002 Mikrokursus i biostatistik 1 Hvad er statistik? Det systematiske studium af tilfældighedernes spil!dyrkes af biostatistikere Anvendes som redskab til vurdering

Læs mere

Statistik med TI-Nspire CAS version 3.2. Bjørn Felsager September 2012. [Fjerde udgave]

Statistik med TI-Nspire CAS version 3.2. Bjørn Felsager September 2012. [Fjerde udgave] Statistik med TI-Nspire CAS version 3.2 Bjørn Felsager September 2012 [Fjerde udgave] Indholdsfortegnelse Forord Beskrivende statistik 1 Grundlæggende TI-Nspire CAS-teknikker... 4 1.2 Lister og regneark...

Læs mere

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven. PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve

Læs mere

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese Kursus 02402 Introduktion til Statistik Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Per Bruun Brockhoff DTU Compute, Statistik Bygning 305/324 Danmarks Tekniske Universitet

Læs mere

Dig og din puls Lærervejleding

Dig og din puls Lærervejleding Dig og din puls Lærervejleding Indledning I det efterfølgende materiale beskrives et forløb til matematik C, hvori eleverne skal måle hvilepuls og arbejdspuls og beskrive observationerne matematisk. Materialet

Læs mere

2 -test. Fordelingen er særdeles kompleks at beskrive med matematiske formler. 2 -test blev opfundet af Pearson omkring år 1900.

2 -test. Fordelingen er særdeles kompleks at beskrive med matematiske formler. 2 -test blev opfundet af Pearson omkring år 1900. 2 -fordeling og 2 -test Generelt om 2 -fordelingen 2 -fordelingen er en kontinuert fordeling, modsat binomialfordelingen som er en diskret fordeling. Fordelingen er særdeles kompleks at beskrive med matematiske

Læs mere

1 Problemformulering CYKELHJELM

1 Problemformulering CYKELHJELM 1 Problemformulering I skal undersøge hvor mange cyklister, der kommer til skade og hvor alvorlige, deres skader er. I skal finde ud af, om cykelhjelm gør nogen forskel, hvis man kommer ud for en ulykke.

Læs mere

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0 Hypotesetest Hypotesetest generelt Ingredienserne i en hypotesetest: Statistisk model, f.eks. X 1,,X n uafhængige fra bestemt fordeling. Parameter med estimat. Nulhypotese, f.eks. at antager en bestemt

Læs mere

Baggrundsnotat: Søskendes uddannelsesvalg og indkomst

Baggrundsnotat: Søskendes uddannelsesvalg og indkomst 17. december 2013 Baggrundsnotat: Søskendes uddannelsesvalg og indkomst Dette notat redegør for den økonometriske analyse af indkomstforskelle mellem personer med forskellige lange videregående uddannelser

Læs mere

CMU PROJEKT HYPOTESETEST OG SIMULERING MICHAEL AGERMOSE JENSEN CHRISTIANSHAVNS GYMNASIUM

CMU PROJEKT HYPOTESETEST OG SIMULERING MICHAEL AGERMOSE JENSEN CHRISTIANSHAVNS GYMNASIUM CMU PROJEKT HYPOTESETEST OG SIMULERING MICHAEL AGERMOSE JENSEN CHRISTIANSHAVNS GYMNASIUM FORMÅL - BEKENDTGØRELSEN STX MATEMATIK A Kompetencer anvende simple statistiske eller sandsynlighedsteoretiske modeller

Læs mere

Løsning til opgave 7, 9, 10 og 11C Matematik B Sommer 2014

Løsning til opgave 7, 9, 10 og 11C Matematik B Sommer 2014 Vejledning til udvalgte opgave fra Matematik B, sommer 2014 Opgave 7 Størrelsen og udbudsprisen på 100 fritidshuse på Rømø er indsamlet via boligsiden.dk. a) Grafisk præsentation, der beskriver fordelingen

Læs mere

Værktøjshjælp for TI-Nspire CAS Struktur for appendiks:

Værktøjshjælp for TI-Nspire CAS Struktur for appendiks: Værktøjshjælp for TI-Nspire CAS Struktur for appendiks: Til hvert af de gennemgåede værktøjer findes der 5 afsnit. De enkelte afsnit kan læses uafhængigt af hinanden. Der forudsættes et elementært kendskab

Læs mere

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test] Anvendt Statistik Lektion 6 Kontingenstabeller χ 2 -test [ki-i-anden-test] 1 Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination

Læs mere

I. Deskriptiv analyse af kroppens proportioner

I. Deskriptiv analyse af kroppens proportioner Projektet er delt i to, og man kan vælge kun at gennemføre den ene del. Man kan vælge selv at frembringe data, fx gennem et samarbejde med idræt eller biologi, eller man kan anvende de foreliggende data,

Læs mere

Vejledende besvarelser til opgaver i kapitel 14

Vejledende besvarelser til opgaver i kapitel 14 Vejledende besvarelser til opgaver i kapitel 14 Opgave 1 a) Det første trin i opstillingen af en hypotesetest er at formulere to hypoteser, hvoraf den ene støtter den teori vi vil teste, mens den anden

Læs mere

Hvad er meningen? Et forløb om opinionsundersøgelser

Hvad er meningen? Et forløb om opinionsundersøgelser Hvad er meningen? Et forløb om opinionsundersøgelser Jette Rygaard Poulsen, Frederikshavn Gymnasium og HF-kursus Hans Vestergaard, Frederikshavn Gymnasium og HF-kursus Søren Lundbye-Christensen, AAU 17-10-2004

Læs mere

Deskriptiv statistik. Version 2.1. Noterne er et supplement til Vejen til matematik AB1. Henrik S. Hansen, Sct. Knuds Gymnasium

Deskriptiv statistik. Version 2.1. Noterne er et supplement til Vejen til matematik AB1. Henrik S. Hansen, Sct. Knuds Gymnasium Deskriptiv (beskrivende) statistik er den disciplin, der trækker de væsentligste oplysninger ud af et ofte uoverskueligt materiale. Det sker f.eks. ved at konstruere forskellige deskriptorer, d.v.s. regnestørrelser,

Læs mere

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06)

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06) Afdeling for Biostatistik Bo Martin Bibby 23. november 2006 Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06) Vi betragter 4699 personer fra Framingham-studiet. Der er oplysninger om follow-up

Læs mere

Skriftligt samfundsfag

Skriftligt samfundsfag Skriftligt samfundsfag Taksonomiske niveauer og begreber Her kan du læse om de forskellige spørgeord, du kan møde i samfundsfag i skriftlige afleveringer, SRO, SRP osv. Redegørelse En redegørelse er en

Læs mere

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05 Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ

Læs mere

Samfundsfagslærerens lille manual vol. II

Samfundsfagslærerens lille manual vol. II Samfundsfagslærerens lille manual vol. II Hvilke beregningsopgaver bør trænes i undervisningen? Formålet her er, at danne overblik over hvilke beregningsopgaver der hører ind under daglig samfundsfagsundervisningen

Læs mere

Bilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen

Bilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen Bilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen Microsoft Excel har en del standard anvendelsesmuligheder i forhold til den beskrivende statistik og statistisk

Læs mere

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ

Læs mere

Et statistisk test er en konfrontation af virkelighenden (data) med en teori (model).

Et statistisk test er en konfrontation af virkelighenden (data) med en teori (model). Hypotesetests, fejltyper og p-værdier og er den nu også det? Søren Højsgaard Institut for Matematiske Fag, Aalborg Universitet (updated: 2019-03-17) 1 / 40 Statistisk test Et statistisk test er en konfrontation

Læs mere

Projekt 1 Spørgeskemaanalyse af Bedst på Nettet

Projekt 1 Spørgeskemaanalyse af Bedst på Nettet Projekt 1 Spørgeskemaanalyse af Bedst på Nettet D.29/2 2012 Udarbejdet af: Katrine Ahle Warming Nielsen Jannie Jeppesen Schmøde Sara Lorenzen A) Kritik af spørgeskema Set ud fra en kritisk vinkel af spørgeskemaet

Læs mere

Inklusions rapport i Rebild Kommune Elever fra 4. til 10. klasse Rapport status Læsevejledning Indholdsfortegnelse Analyse Din Klasse del 1

Inklusions rapport i Rebild Kommune Elever fra 4. til 10. klasse Rapport status Læsevejledning Indholdsfortegnelse Analyse Din Klasse del 1 Inklusions rapport i Rebild Kommune Elever fra 4. til 10. klasse Nærværende rapport giver et overblik over, hvorledes eleverne fra 4. til 10. klasse i Rebild Kommune trives i forhold til deres individuelle

Læs mere

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter Program Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve Helle Sørensen E-mail: helle@math.ku.dk I formiddag: Øvelse: effekt af diæter. Repetition fra sidst... Parrede og ikke-parrede

Læs mere

EVALUERING AF BOLIGSOCIALE AKTIVITETER

EVALUERING AF BOLIGSOCIALE AKTIVITETER Guide EVALUERING AF BOLIGSOCIALE AKTIVITETER Det er rart at vide, om en aktivitet virker. Derfor følger der ofte et ønske om evaluering med, når I iværksætter nye aktiviteter. Denne guide er en hjælp til

Læs mere

Kapitel 7 Forskelle mellem centraltendenser

Kapitel 7 Forskelle mellem centraltendenser Kapitel 7 Forskelle mellem centraltendenser Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 / 29 Indledning 1. z-test for ukorrelerede data 2. t-test for ukorrelerede data med ens

Læs mere

Metoder og struktur ved skriftligt arbejde i idræt.

Metoder og struktur ved skriftligt arbejde i idræt. Metoder og struktur ved skriftligt arbejde i idræt. Kort gennemgang omkring opgaver: Som udgangspunkt skal du når du skriver opgaver i idræt bygge den op med udgangspunkt i de taksonomiske niveauer. Dvs.

Læs mere

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Introduktion Kursusholder: Kasper K. Berthelsen Opbygning: Kurset består af 5 blokke En blok består af: To normale

Læs mere

Skolevægring. Resultater fra en spørgeskemaundersøgelse blandt skoleledere på danske folkeskoler og specialskoler

Skolevægring. Resultater fra en spørgeskemaundersøgelse blandt skoleledere på danske folkeskoler og specialskoler Skolevægring Resultater fra en spørgeskemaundersøgelse blandt skoleledere på danske folkeskoler og specialskoler Udarbejdet af Analyse & Tal for Institut for Menneskerettigheder juli 017 Indledning Udsendelse

Læs mere

UNDERVISNINGSEFFEKT-MODELLEN 2006 METODE OG RESULTATER

UNDERVISNINGSEFFEKT-MODELLEN 2006 METODE OG RESULTATER UNDERVISNINGSEFFEKT-MODELLEN 2006 METODE OG RESULTATER Undervisningseffekten udregnes som forskellen mellem den forventede og den faktiske karakter i 9. klasses afgangsprøve. Undervisningseffekten udregnes

Læs mere

- Panelundersøgelse, Folkeskolen, februar 2013 FOLKESKOLEN. Undersøgelse om syn på kønnets betydning for fag- og uddannelsesvalg

- Panelundersøgelse, Folkeskolen, februar 2013 FOLKESKOLEN. Undersøgelse om syn på kønnets betydning for fag- og uddannelsesvalg FOLKESKOLEN Undersøgelse om syn på kønnets betydning for fag- og uddannelsesvalg 2013 Udarbejdet af Scharling Research for redaktionen af Folkeskolen, februar 2013 Formål Scharling.dk Side 1 af 14 Metode

Læs mere

Fig. 1 Billede af de 60 terninger på mit skrivebord

Fig. 1 Billede af de 60 terninger på mit skrivebord Simulation af χ 2 - fordeling John Andersen Introduktion En dag kastede jeg 60 terninger Fig. 1 Billede af de 60 terninger på mit skrivebord For at danne mig et billede af hyppighederne flyttede jeg rundt

Læs mere

Kort gennemgang af Samfundsfaglig-, Naturvidenskabeligog

Kort gennemgang af Samfundsfaglig-, Naturvidenskabeligog Kort gennemgang af Samfundsfaglig-, Naturvidenskabeligog Humanistisk metode Vejledning på Kalundborg Gymnasium & HF Samfundsfaglig metode Indenfor det samfundsvidenskabelige område arbejdes der med mange

Læs mere

Det gode liv Et uddrag af resultaterne fra borgerpanelsundersøgelsen. Analyse, Viden & Strategi Efteråret 2017

Det gode liv Et uddrag af resultaterne fra borgerpanelsundersøgelsen. Analyse, Viden & Strategi Efteråret 2017 Det gode liv Et uddrag af resultaterne fra borgerpanelsundersøgelsen Analyse, Viden & Strategi Efteråret 207 Baggrund og formål Byrådet i Ringkøbing-Skjern Kommune vedtog i 204 politikken om det gode liv.

Læs mere

Elevundersøgelse 2013-14

Elevundersøgelse 2013-14 Elevundersøgelse 13-14 Første del En undersøgelse af elevers oplevede pres i gymnasiet. Elevbevægelsens Hus Vibevej 31 2 København NV Indhold Indledning Datagrundlag 4 5 DEL 1: Profil på alle respondenter

Læs mere

Hvad er skriftlig samfundsfag. Redegør

Hvad er skriftlig samfundsfag. Redegør Hvad er skriftlig samfundsfag... 2 Redegør... 2 Angiv og argumenter... 2 Opstil hypoteser... 3 Opstil en model... 4 HV-ord, tabellæsning og beregninger... 5 Undersøg... 6 Sammenlign synspunkter... 7 Diskuter...

Læs mere

Statistik viden eller tilfældighed

Statistik viden eller tilfældighed MATEMATIK i perspektiv Side 1 af 9 DNA-analyser 1 Sandsynligheden for at en uskyldig anklages Følgende histogram viser, hvordan fragmentlængden for et DNA-område varierer inden for befolkningen. Der indgår

Læs mere

Behandling af kvantitative data 19.11.2012

Behandling af kvantitative data 19.11.2012 Behandling af kvantitative data 19.11.2012 I dag skal vi snakke om Kvantitativ metode i kort form Hvordan man kan kode og indtaste data Data på forskellig måleniveau Hvilke muligheder, der er for at analysere

Læs mere

Test nr. 6 af centrale elementer 02402

Test nr. 6 af centrale elementer 02402 QuizComposer 2001- Olaf Kayser & Gunnar Mohr Contact: admin@quizcomposer.dk Main site: www.quizcomposer.dk Test nr. 6 af centrale elementer 02402 Denne quiz angår forståelse af centrale elementer i kursus

Læs mere

Taldata 1. Chancer gennem eksperimenter

Taldata 1. Chancer gennem eksperimenter Taldata 1. Chancer gennem eksperimenter Indhold 1. Kast med to terninger 2. Et pindediagram 3. Sumtabel 4. Median og kvartiler 5. Et trappediagram 6. Gennemsnit 7. En statistik 8. Anvendelse af edb 9.

Læs mere

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning Introduktion Kasper K. Berthelsen, Inst f. Matematiske Fag Omfang: 8 Kursusgang I fremtiden

Læs mere

Analyse af en lineær regression med lav R 2 -værdi

Analyse af en lineær regression med lav R 2 -værdi Analyse af en lineær regression med lav R 2 -værdi Denne gennemgang omhandler figur 13 i Regn med biologi. Man kan sagtens lave beregninger på egne data. Forsøgsmæssigt kræver det bare en tommestok tapet

Læs mere

1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau...

1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau... Indhold 1 Statistisk inferens: Hypotese og test 2 1.1 Nulhypotese - alternativ.................................. 2 1.2 Teststatistik........................................ 3 1.3 P-værdi..........................................

Læs mere

Appendiks 6: Universet som en matematisk struktur

Appendiks 6: Universet som en matematisk struktur Appendiks 6: Universet som en matematisk struktur En matematisk struktur er et meget abstrakt dyr, der kan defineres på følgende måde: En mængde, S, af elementer {s 1, s 2,,s n }, mellem hvilke der findes

Læs mere

Radius Kommunikation // November Troværdighedsundersøgelsen 2016

Radius Kommunikation // November Troværdighedsundersøgelsen 2016 Radius Kommunikation // November 2016 Troværdighedsundersøgelsen 2016 1 Indholdsfortegnelse TROVÆRDIGHEDSUNDERSØGELSEN 2016...1 AFSNIT 1: OM TROVÆRDIGHEDSUNDERSØGELSEN...3 AFSNIT 2: FAGGRUPPERNES TROVÆRDIGHED...4

Læs mere

Samfundsfag og matematik

Samfundsfag og matematik Samfundsfag og matematik Piketty: Kapitalismens 2. grundlæggende lov: β = s/g Lineær regression: y = ax + b Beregninger med Excel: Indekstal = C6/$B6*100. Diagram Chi^2-test: p = 0,04 Brug af egen spørgeskemaundersøgelse

Læs mere

Analyse af dagpengesystemet

Analyse af dagpengesystemet Analyse af dagpengesystemet Udarbejdet september/oktober 2011 BD272 Indhold Indledning... 2 Metode og validitet... 2 Dataindsamling fra... 2 Dataindsamling fra den øvrige befolkning... 2 Forventninger

Læs mere

Maple 11 - Chi-i-anden test

Maple 11 - Chi-i-anden test Maple 11 - Chi-i-anden test Erik Vestergaard 2014 Indledning I dette dokument skal vi se hvordan Maple kan bruges til at løse opgaver indenfor χ 2 tests: χ 2 - Goodness of fit test samt χ 2 -uafhængighedstest.

Læs mere

(Projektets første del er rent deskriptiv, mens anden del peger frem mod hypotesetest. Projektet kan gemmes til dette emne, eller tages op igen der)

(Projektets første del er rent deskriptiv, mens anden del peger frem mod hypotesetest. Projektet kan gemmes til dette emne, eller tages op igen der) Projekt 2.4 Menneskets proportioner (Projektets første del er rent deskriptiv, mens anden del peger frem mod hypotesetest. Projektet kan gemmes til dette emne, eller tages op igen der) I. Deskriptiv analyse

Læs mere

J E T T E V E S T E R G A A R D

J E T T E V E S T E R G A A R D BINOMIALT EST J E T T E V E S T E R G A A R D F I P B I O L O G I M A R S E L I S B O R G G Y M N A S I U M D. 1 3. M A R T S 2 0 1 9 K A L U N D B O R G G Y M N A S I U M D. 1 4. M A R T S 2 0 1 9 HVEM

Læs mere

Forberedelse. Forberedelse. Forberedelse

Forberedelse. Forberedelse. Forberedelse Formidlingsopgave AT er i høj grad en formidlingsopgave. I mange tilfælde vil du vide mere om emnet end din lærer og din censor. Det betyder at du skal formidle den viden som du er kommet i besiddelse

Læs mere

Digitalt børne- og ungdomsliv anno 2009

Digitalt børne- og ungdomsliv anno 2009 Digitalt børne- og ungdomsliv anno 2009 MEDIERÅDET For Børn og Unge Februar 2009 Zapera A/S Robert Clausen, rc@zapera.com, 3022 4253. Side 1 af 53 Ideen og baggrunden for undersøgelsen. Medierådet for

Læs mere

AARHUS KOMMUNE BRUGERTILFREDSHEDSUNDERSØGELSE 2017 BOSTØTTE, BOFÆLLESSKABER OG BOTILBUD I VOKSENHANDICAP

AARHUS KOMMUNE BRUGERTILFREDSHEDSUNDERSØGELSE 2017 BOSTØTTE, BOFÆLLESSKABER OG BOTILBUD I VOKSENHANDICAP AARHUS KOMMUNE BRUGERTILFREDSHEDSUNDERSØGELSE 2017 BOSTØTTE, BOFÆLLESSKABER OG BOTILBUD I VOKSENHANDICAP INDHOLD Afsnit 01 Introduktion Side 03 Afsnit 02 Læsevejledning Side 05 Afsnit 03 Sammenfatning

Læs mere

Mobning på arbejdspladsen. En undersøgelse af oplevelser med mobning blandt STEM-ansatte

Mobning på arbejdspladsen. En undersøgelse af oplevelser med mobning blandt STEM-ansatte Mobning på arbejdspladsen En undersøgelse af oplevelser med mobning blandt STEM-ansatte September 2018 Mobning på arbejdspladsen Resumé Inden for STEM (Science, Technology, Engineering & Math) var der

Læs mere

c) For, er, hvorefter. Forklar.

c) For, er, hvorefter. Forklar. 1 af 13 MATEMATIK B hhx Udskriv siden FACITLISTE TIL KAPITEL 7 ØVELSER ØVELSE 1 c) ØVELSE 2 og. Forklar. c) For, er, hvorefter. Forklar. ØVELSE 3 c) ØVELSE 4 90 % konfidensinterval: 99 % konfidensinterval:

Læs mere

Kønsproportion og familiemønstre.

Kønsproportion og familiemønstre. Københavns Universitet Afdeling for Anvendt Matematik og Statistik Projektopgave forår 2005 Kønsproportion og familiemønstre. Matematik 2SS Inge Henningsen februar 2005 Indledning I denne opgave undersøges,

Læs mere

LUP Fødende læsevejledning til afdelingsrapporter

LUP Fødende læsevejledning til afdelingsrapporter Indhold Hvordan du bruger læsevejledningen... 1 Oversigtsfigur... 2 Temafigur... 3 Spørgsmålstabel... 4 Respondenter og repræsentativitet... 6 Uddybende forklaring af elementer i figurer og tabeller...

Læs mere

At lave dit eget spørgeskema

At lave dit eget spørgeskema At lave dit eget spørgeskema 1 Lectio... 2 2. Spørgeskemaer i Google Docs... 2 3. Anvendelighed af din undersøgelse - målbare variable... 4 Repræsentativitet... 4 Fejlkilder: Målefejl - Systematiske fejl-

Læs mere

Børnefamilier: Aftensmaden er noget, vi samles om

Børnefamilier: Aftensmaden er noget, vi samles om Børnefamilier: Aftensmaden er noget, vi samles om November 2018 Markedsanalyse, Forbrugerøkonomi & Statistik Markedsanalyse 2. november 2018 Axelborg, Axeltorv 3 1609 København V T +45 3339 4000 F +45

Læs mere

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele Anvendt Statistik Lektion 4 Hypotesetest generelt Test for middelværdi Test for andele Hypoteser og Test Hypotese I statistik er en hypotese en påstand om en populationsparameter. Typisk en påstand om

Læs mere

Evalueringsnotat: Efterladte børn i alderen 2-15 år

Evalueringsnotat: Efterladte børn i alderen 2-15 år : 1 Et kort overblik over efterladte børn i alderen 2-15 år Vi ønsker med dette notat at give et indblik i karakteristika og belastningsgrad hos de børn, som har modtaget et tilbud hos Børn, Unge & Sorg

Læs mere

Et CAS program til Word.

Et CAS program til Word. Et CAS program til Word. 1 WordMat WordMat er et CAS-program (computer algebra system) som man kan downloade gratis fra hjemmesiden www.eduap.com/wordmat/. Programmet fungerer kun i Word 2007 og 2010.

Læs mere

Rapport vedrørende. etniske minoriteter i Vestre Fængsel. Januar 2007

Rapport vedrørende. etniske minoriteter i Vestre Fængsel. Januar 2007 Rapport vedrørende etniske minoriteter i Vestre Fængsel Januar 2007 Ved Sigrid Ingeborg Knap og Hans Monrad Graunbøl 1 1. Introduktion Denne rapport om etniske minoriteter på KF, Vestre Fængsel er en del

Læs mere

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau Hvad skal vi lave? 1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ. Teststatistik P-værdi Signifikansniveau 2 t-test for middelværdi Tosidet t-test for middelværdi Ensidet t-test for middelværdi

Læs mere

Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6

Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Kursus 02402 Introduktion til Statistik Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220

Læs mere

LUP læsevejledning til afdelingsrapporter

LUP læsevejledning til afdelingsrapporter Indhold Hvordan du bruger læsevejledningen... 1 Oversigtsfigur... 2 Temafigur... 3 Spørgsmålstabel... 4 Respondenter og repræsentativitet... 6 Uddybende forklaring af elementer i figurer og tabeller...

Læs mere

Afsluttende opgave. Navn: Lykke Laura Hansen. Klasse: 1.2. Skole: Roskilde Tekniske Gymnasium. Fag: Kommunikation/IT

Afsluttende opgave. Navn: Lykke Laura Hansen. Klasse: 1.2. Skole: Roskilde Tekniske Gymnasium. Fag: Kommunikation/IT Afsluttende opgave Navn: Lykke Laura Hansen Klasse: 1.2 Skole: Roskilde Tekniske Gymnasium Fag: Kommunikation/IT Opgave: Nr. 2: Undervisningsmateriale Afleveres: den 30. april 2010 Indholdsfortegnelse

Læs mere

Konfidensintervaller og Hypotesetest

Konfidensintervaller og Hypotesetest Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele Repetition fra sidst: Konfidensintervaller

Læs mere

At træffe sine valg i en usikker verden - eller den statistiske modellerings rolle.

At træffe sine valg i en usikker verden - eller den statistiske modellerings rolle. At træffe sine valg i en usikker verden - eller den statistiske modellerings rolle. Af E. Susanne Christensen. Lektor i statistik. Institut for Matematiske Fag. Aalborg Universitet. I mange tilfælde og

Læs mere

Ensomhed blandt ældre

Ensomhed blandt ældre Ensomhed blandt ældre Af Nadja Hedegaard Andersen, k Dato: E-mail: 336 Side af 8 Formålet med dette analysenotat er at belyse ensomhed blandt gruppen af ældre (6+ år) i Danmark. Analysen bygger på data

Læs mere

WORKSHOP 2C, DLF-kursus, Krogerup, 26. november 2015

WORKSHOP 2C, DLF-kursus, Krogerup, 26. november 2015 WORKSHOP 2C, DLF-kursus, Krogerup, 26. november 2015 At I får overblik over statistik og sandsynlighed som fagområde i folkeskolen indblik i didaktiske forskeres anbefalinger til undervisningen i statistik

Læs mere

Statistik. Peter Sørensen: Statistik og sandsynlighed Side 1

Statistik. Peter Sørensen: Statistik og sandsynlighed Side 1 Statistik Formålet... 1 Mindsteværdi... 1 Størsteværdi... 1 Ikke grupperede observationer... 2 Median og kvartiler defineres ved ikke grupperede observationer således:... 2 Middeltal defineres ved ikke

Læs mere

Sundhedsvaner og trivsel blandt 7.-9. klasser på Jels Skole

Sundhedsvaner og trivsel blandt 7.-9. klasser på Jels Skole Vejen Kommune Sundhedsvaner og trivsel blandt 7-9 klasser på December 2006 2 Indholdsfortegnelse 1 Indledning 4 2 Læsevejledning 5 3 Helbred og trivsel 7 31 Selvvurderet helbred 7 32 Almen trivsel 7 33

Læs mere

NOTATSERIE. Medborgerskab Notat nr. 1: Nydanskeres holdninger til kønsroller

NOTATSERIE. Medborgerskab Notat nr. 1: Nydanskeres holdninger til kønsroller NOTATSERIE Medborgerskab 17 Notat nr. 1: Nydanskeres holdninger til kønsroller AUGUST 17 Nydanskeres holdninger til kønsroller 1. Hovedpointer Indvandreres og efterkommeres holdninger til kønsroller adskiller

Læs mere

Pigerne er bedst til matematik i gymnasiet

Pigerne er bedst til matematik i gymnasiet ANALYSE Pigerne er bedst til matematik i gymnasiet I den offentlige debat fremstilles det ofte som om, at sprog er noget for piger, mens matematik er noget for drenge. Denne analyse viser, at det langt

Læs mere