Statistik i matematik og biologi

Størrelse: px
Starte visningen fra side:

Download "Statistik i matematik og biologi"

Transkript

1 Statistik i matematik og biologi Peter Wulff og Susanne Højte Del 1: Deskriptiv statistik Del 2: Sandsynlighedsregning og hypotesetest i forbindelse med genetik. Matematiklærerforeningen 2018

2 Indholdsfortegnelse Indholdsfortegnelse... 1 Forord... 1 Del 1: Beskrivende statistik og dataindsamling Data-links... 3 Del 2: Mendel og Hardy-Weinberg-modellen... 9 Mendel: 1-gen-udspaltning... 9 Mendel: 2-gen-udspaltning...10 Hardy-Weinberg-modellen...12 Brug af Hardy-Weinberg...13 Test af Hardy-Weinberg-ligevægt når p og q beregnes ud fra fænotyper...15 Blodtyper - en case med både biologiske og matematiske pointer og præciseringer alleler, dominans og codominans...18 Frihedsgrader...20 Eksamensopgaver...23 Appendiks A udregninger i Maple...29 Forord Det er oplagt, at fagene matematik og biologi arbejder sammen i forbindelse med emnet statistik og sandsynlighed, idet eleverne i matematik dels skal arbejde med større datamateriale og dels selv skal indsamle data. Derudover er der masser af sandsynlighedsregning at tage fat på i forbindelse med Hardy- Weinberg-modellen, der er kernestof til den skriftlige eksamen i biologi A. Dette materiale er delt i to, en beskrivende statistik del og en genetik-del, med brug af sandsynlighedsregning og hypotesetest. Den første del tager afsæt i dataindsamling, både fra elever og fra databank, for så at runde af med overgang til chi-i-anden-test. Denne del er tænkt som inspiration til lærere, men indeholder også konkrete øvelser til elever. I genetikdelen berøres kort den klassiske genetik (Mendel), mens Hardy-Weinberg modellen gennemgås grundigere med eksempler og øvelser. Denne del er skrevet, så elever med kendskab til klassisk genetik og hypotestest med chi-i-anden selv kan arbejde sig igennem såvel tekst som de tilhørende øvelser. Det er tilstræbt at øvelserne både sikrer matematiske og biologiske overvejelser. 1

3 Uanset om det drejer sig om beskrivende (deskriptiv) eller bekræftende (inferentiel) statistik, så er det vigtigt, at man gør sig nogle grundlæggende overvejelser: Hvad ønsker man at få viden om og hvis man vha. statistikken påviser en sammenhæng, kan denne så forklares ud fra reel biologisk viden eller skyldes sammenhængen skjulte variable eller tilfældigheder. Det er altså vigtigt at bruge biologisk viden til at vurdere, hvad der er årsag og hvad der er virkning, idet statistikken kun kan påvise en mulig sammenhæng og ikke en forklaring. For bekræftende statistik er det vigtigt, at man gør sig klart, hvad der er ens stikprøve og hvad der er populationen, og at man er præcis i formuleringen af ens nulhypotese om populationen. Det er vigtigt, at man er fortrolige med betydningen af begreberne population, stikprøve, teststørrelse, signifikansniveau og p-værdi, da de er essentielle for, hvad man kan konkludere ud fra ens undersøgelser. Udregninger og grafer i hoveddelen af materialet er udarbejdet i Nspire. I appendiks A er samme udregninger og grafer desuden udarbejdet i Maple. Vi vil gerne takke kolleger og specielt Jan Sørensen for kritisk læsning, sparring samt udarbejdelse af eksempler i Maple. 2

4 Del 1: Beskrivende statistik og dataindsamling. Der findes en række databaser hvor der kan findes interessant biologisk data, som kan gøres til genstand for statistisk bearbejdning. Data-links Større datamateriale kan bl.a. findes på eller via Danmarks statistiks hjemmeside hvor der videre er et link til statistikbanken Det kan bestemt anbefales at læse vejledningerne til de enkelte hjemmesider (f.eks. I disse vejledninger kan der bl.a. læses om baggrunden for indsamlingen, forklaringer til og muligheder med datamaterialet samt placeringen af den uafhængige og den afhængige variabel i tabelmaterialet. Surveybanken er bl.a. udarbejdet i samarbejde med samfundsfagslærere, hvilket betyder, at der er flest undersøgelser, der omhandler politiske og samfundsfaglige parametre. Det er oplysninger som politisk tilhørsforhold, uddannelsesniveau og økonomisk situation. Men de er alle parametre, der også påvirker den enkeltes samlede sundhedsprofil, og kan derfor også inddrages i biologiundervisningen. I f.eks. Statistikbanken er der rig mulighed for præsentation af data på mange måder, fx søjle- og cirkeldiagrammer, og der er mulighed for at eksportere data til Excel, og så evt. videre derfra til et CASværktøj. Nedenfor gennemgås, hvordan data kan overføres fra Statistikbanken til CAS-værktøjet Nspire. Dataoverførsel fra Statistikbanken til Nspire. For at blive i stand til at lave og præsentere boksplot i Nspire skal de fundne data overføres hertil. Hvis ikke det fungerer med at markere og kopiere fra tabel i Statistikbanken til Lister og Regneark i Nspire, så kan man vælge Åbn/Gem (i venstre hjørne), gemme som excel og herfra markere og kopiere efterfulgt af indsæt i Nspire. Vælges at regne med procenttal så forekommer der ofte decimaltal med kommaet,. Når kommatal skal overføres til Nspire, så skal de først overføres til excel, og herefter ændres vha. Søg og erstat fra, til. Så er tallene klar til at blive kopieret til Nspire. 3

5 Her ses boksplot for aldersfordelingen for de to dødsårsager hhv. Infektionssygdom og Motorkøretøjsulykker i 2014: Figur 1 Aldersfordelingen for dødsårsagerne Infektionssygdomme og Motorkøretøjsulykker for mænd i Øvelse 1 a) Hvilke fordele er der ved at bruge boksplot? b) Hvilken type information går tabt ved brug af boksplot? c) Hvorfor er risikoen for at dø i en trafikulykke ikke den samme for årige mænd som for mænd på 85 år eller derover, selvom der i begge kategorier omkom 11 i 2014? Ideer til målinger Her følger en række ideer til biologiske målinger elever selv kan foretage og efterfølgende lave statistik på: Hæmatokritværdier, hoppehøjde, fedt-frie-vægt, håndstyrke, søvn og stress-sammenhæng, BMI, kondital, puls (hvile, arbejde, siddende, liggende), hofte-taljemål, vitalkapacitet og brystmål. Nedenfor ses, hvordan man f.eks. kan behandle elevdata som kondital samt eventuel sammenhæng mellem søvnkvalitet og stressniveau hos eleverne. Kondital Klassiske målinger i både biologi og idrætsundervisningen er elevernes kondital. Resultaterne for to idrætsstudieretninger giver anledning til følgende boksplot for de to køn (rå data kan findes i appendiks) : 4

6 Af disse to boksplot ses, at drengene har et højere kondital end pigerne i de 2 klasser. Øvelse 2 a) Kan man forklare forskellen biologisk? b) Hvordan ville resultatet sandsynligvis have set ud hvis man havde lavet den samme undersøgelse i en 1.klasse? i en 7.klasse? Begrund igen dit svar med din biologiske viden. c) Hvilke skjulte variable kan der være tale om i en sådan undersøgelse? d) Hvis vi opfatter eleverne i de to studieretninger, som en stikprøve, hvilken del af befolkningen er denne undersøgelse så repræsentativ for? Figur 2 Fordelingen af kondital for henholdsvis drenge (øverst) og piger (nederst) i to gymnasieklasser. Forskellen mellem drenge og piger kan jo skyldes tilfældigheder, men ved at udføre en chi-i-anden uafhængighedstest kan man beregne, om forskellen er signifikant. For at kunne teste dette kan man inddele data i nogle kategorier og udføre en uafhængighedstest. Inddelingen i kategorier kan f.eks. foretages efter nedenstående skema fra en biologibog. Bemærk at tabellen er et eksempel på fagenes forskellige tilgang til præsentation af data, idet f.eks. konditallet 44.7 for mænd ikke kan placeres entydigt. I det følgende er f.eks. kategorien tolket som intervallet [45;50[. Figur 3 Kondital inddelt i niveauet og køn. (Kilde: Biologi til tiden, Nucleus, Figur 65.) Hvis man bruger denne inddeling på resultaterne for de to studieretninger fås følgende resultater: Lav Under Middel Middel Over middel Høj Mænd år Kvinder år Vi ser at nogle af de observerede værdier er små og får mistanke om, at nogle af de forventede værdier vil være under 5, hvilket ville betyde, at man ikke må udføre et chi-i-anden-test. Den forventede værdi for Mænd i kategorien Lav bliver RRækkkkkkkkkkkk SSøjjjjjjjjjj TTTTTTTTTTTTTTTT mistanken. = = 0.4, hvilket bekræftede Hvis man ikke har mulighed for at indsamle flere data, så kan dette problem omgås ved at slå nogle af de små kategori sammen: 5

7 Mænd år Kvinder år Middel og derunder Over middel Høj Nulhypotesen vil være: Konditalskategorien er uafhængig af køn. Eller mere løst formuleret: Drenge og piger er i lige god (eller dårlig) form. Når der udføres et chi-i-anden-test fås en p-værdi på 1.13%: Konklusionen er derfor, at på et 5% signifikansniveau forkastes nulhypotesen, dvs. drenge og piger er tilsyneladende ikke i lige god form. Øvelse 3 a) Overvej igen hvad der er stikprøve og hvad der er population og dermed hvilke drenge og piger er det konklusionen udtaler sig om? b) Hvad ville det have betydet for undersøgelsen, hvis man helt udelod kategorierne Lav og Under Middel? Overvej ud fra både matematisk og biologisk synspunkt. Ved at sammenligne de forventede værdier med de observerede, kan man få et endnu mere nuanceret svar på, hvorfor nulhypotesen skulle forkastes: Øvelse 4 a) Eftervis CAS-værktøjets forventede værdier ved selv at udregne de forventede værdier ud fra de observerede værdier. b) Hvilken ekstra information kan man få ved at sammenligne disse forventede værdier med de observerede værdier i forhold til drenge og pigers kondital? c) Hvilke informationer får man yderligere ved at inddrage de enkelte kategoriers/cellers bidrag til teststørrelsen? Øvelse 5 a) Hvilke fordele og hvilke ulemper er der ved henholdsvis boksplotpræsentationen og p-værdien for uafhængighedstestet når man bruger kondital til at sammenligne drenge og pigers kondition? 6

8 b) Hvilken overskrift i lokalbladet kan undersøgelsen give anledning til? Søvn og Stress Et andet eksempel hvor man også skal være påpasselig med brug af statistik, er i undersøgelsen herunder. Eleverne i en 2.g er blevet bedt om at notere over 3 dage hvor længe de sov, hvor godt de synes de sov og hvor stressede de følte sig inden de lagde sig til at sove. Søvnlængden er direkte målelig i timer, mens kvalitet og stress skulle vurderes på en skala fra 1 til 10. Søvnkvaliteten 1 svarede til at eleven havde sovet elendigt, mens 10 henviste til at de havde sovet som en drøm. Stressniveau 1 var for den helt ustressede elev, mens tallet 10 henviste til maksimalt stressniveau. Resultaterne for drenge og piger er illustreret ved hjælp af boksplot (og rå data findes i appendiks): Figur 4 Boksplot over drenge og pigers stressniveau (blå bokse), søvnkvalitet (orange bokse) og søvnlængde i timer (grønne bokse). De tre øverste boksplot er for drengenes data, mens de 3 nederste er for pigerne. Øvelse 6 a) Hvad er populationen og hvad er stikprøven i denne undersøgelse? b) Hvad er fordelen og risikoen ved at inddrage subjektive værdier i datamaterialet? c) Find Fejlene - Hvorfor burde de grønne boksplot ikke være placeret sammen med de øvrige resultater, men derimod i en figur for sig selv? - Hvordan skulle skalaerne for henholdsvis Stress og Søvnkvalitet have været, for at man kunne sammenligne dem med boksplot? Det kunne desuden være interessant at undersøge, om der er en sammenhæng mellem f.eks. søvnlængde og søvnkvalitet. Til det formål kan man f.eks. se på et punktplot mellem disse variable for kvinder og mænd samlet og hvert køn for sig. For lettere at kunne se en evt. tendens, er der desuden tilføjet en linje for lineær regression. Det giver følgende plot. 7

9 Lineær regression for kvinder og mænd samlet yy = xx rr 2 = Lineær regression for kvinder yy = xx rr 2 = Lineær regression for mænd yy = xx rr 2 = Som det kan ses, er der ikke meget system for kønnene samlet, og forklaringsgraden er da også meget lav. For mænd alene er sammenhængen endnu mindre tydelig, mens der for kvinder alene grafisk er en vis sammenhæng, men dog med en lav forklaringsgrad. Det skal dog bemærkes, at fordi data kun kan være hele antal i kvalitet og halve timer i længde, vil forklaringsgraden blive lav, da punkterne jo ikke frit kan placere sig normalfordelt omkring linjen, som regression ellers forudsætter. Så det er bedre at se på det grafisk end at forlade sig for meget på forklaringsgraden. Øvelse 7 Lav tilsvarende sammenligninger mellem stress og søvnlængde og mellem stress og søvnkvalitet. 8

10 Del 2: Mendel og Hardy-Weinberg-modellen Gregor Mendel ( ) var en østrigsk munk, som omkring 1860 udførte en række krydsningsforsøg med ærteblomster, som viste sig at få stor betydning for forståelsen af, hvordan arvelige egenskaber videreføres. Han kendte ikke noget til gener og kromosomer, men fandt i praksis ud af, at nogle arvelige egenskaber var dominante, andre recessive, og at disse ved nedarvning optræder i bestemte forhold. Hardy-Weinberg-modellen (også kaldet Hardy-Weinberg loven eller Hardy-Weinberg ligevægt) er opkaldt efter englænderen G. H. Hardy og tyskeren W. Weinberg, som i 1908 uafhængigt af hinanden nåede frem til følgende: I populationer, der er i genetisk ligevægt (Hardy-Weinberg ligevægt), vil frekvensen af det enkelte allel forblive konstant i alle fremtidige generationer. Eller som Hardy skrev i 1908, i modsætning til manges opfattelse på den tid: In a word, there is not the slightest foundation for the idea that a dominant character should show a tendency to spread over a whole population, or that a recessive should tend to die out. Citat fra: Hardy, G. H Mendelian proportions in a mixed population, Science, N. S. Vol. XXVIII: (letter to the editor) Mendel: 1-gen-udspaltning Omkring år 1900 blev Mendels arbejde med krydsninger af ærteplanter genopdaget. Han havde egentlig publiceret sine resultater allerede i 1865, men desværre i et lille tysksproget tidsskrift, som kun få læste. Mendel krydsede bl.a. 2 rene linjer af ærter med hhv. hvide og rødviolette blomster (kaldet P- generationen). Alle planterne i den følgende generation (kaldet F1-generationen) var rødviolette og Mendel konkluderede at den rødviolette farve dominerede over den hvide. Mendel lod herefter en række af F1- planterne selvbestøve og fik nu i afkom (F2-generationen), der var rødviolette eller hvide i forholdet 3 til 1, normalt skrevet 3:1. Dette er forholdet mellem fænotyperne (farverne). Mendel antog, at der måtte være 3 underliggende genotyper, AA, Aa og aa, men at fænotypen for både AA og Aa er ens, nemlig den rødviolette blomst, da A dominerer over a. Krydsningen i F2 kan illustreres med et såkaldt krydsningsskema (Punnet square): P-krydsningen F1-krydsningen F2-forholdet AA aa Aa Aa 1 AA : 2 Aa : 1 aa A a A AA Rødviolet Aa Rødviolet a Aa Rødviolet aa Hvid 9

11 For at bekræfte sin hypotese om fordeling af genotyperne lod Mendel nu planterne i F2-generationen selvbestøve og fandt, at alle de hvide kun fik hvidt afkom, at 1/3 af de rødviolette kun fik rødviolet afkom, og at 2/3 af de rødviolette fik afkom, der igen var i forholdet 3:1 mellem rødviolet og hvid. Øvelse 8 a) Forklar ovenstående resultater ved selvbestøvning af F2-planterne. b) Hvilke naturvidenskabelige metoder benytter Mendel sig af i sit arbejde med ærteplanterne? I naturen er udspaltningsforholdene desværre noget mere komplicerede end hvad Mendel opdagede i sine forsøg. Mendel: 2-gen-udspaltning Mendel viste, at hvis man følger 2 egenskaber, hvor hver egenskab har en dominerende og en recessiv allel, så vil man forvente at få 2 2 = 4 forskellige fænotyper i forholdet 9:3:3:1. Udspaltningen i F2-generationen kan dog nogle gange give en anden fordeling eller færre fænotyper. En anden fordeling sker, når der er to egenskaber (gener), der følges ad (er koblede), fordi generne sidder på samme kromosom. Dette resulterer i overvægt af forældretyperne (P) i F2-generationen. Færre fænotyper ses, når flere gener har indflydelse på den samme egenskab (epistasi). Ved epistasi dækker et genpars fænotype over et anden genpars fænotype. Øvelse 9 Hos nogle gnavere ses epistasi i pelsfarven som illustreret i skemaet her: a) Hvad repræsenterer bogstaverne A, a, C og c? b) Hvilken genotype knytter sig til de 3 farver? c) Hvilken genotype resulterer mod forventning ikke i sin egen fænotype? Kilde: 10

12 Øvelse 10 En biolog observerer hos en særlig art af gnavere i Texas, at disse har ovenstående 3 pelsfarver. Hun indfanger derfor nogle hvide og brune eksemplarer og krydser disse i flere generationer. For hver generation sorteres afvigerne fra og efter flere generationer er hun sikker på, at der er tale om rene linjer, med dobbelt homozygote individer. Hun krydser nu en hvid med en brun og lader herefter afkommet (F1) befrugte hinanden. Farvefordelingen hos 128 F2-gnavere er som følger: Antal gnavere Brune Sorte Albino Biologen var interesseret i at undersøge, om denne farvefordeling kan forklares med epistasi og dermed følger fordelingen 9:3:4. Det er tydeligt at se, at gnaverne ikke præcist har den rette fordeling, men spørgsmålet er, om afvigelsen bare skyldes tilfældig variation eller om der er tale om en helt anden fordeling. a) Overvej hvad der er population og hvad der er stikprøve i denne undersøgelse. b) Opstil nulhypotesen, der passer til det biologen ville undersøge. c) Opstil den alternative hypotese d) Vælg signifikansniveau e) Udregn de forventede værdier f) Udregn tesstørrelsen g) Hvad er konklusionen på denne χχ 2 -test? Øvelse 11 Senere indfanger biologen i naturen den samme art gnaver og hun får følgende resultater: Antal gnavere Brune Sorte Albino Med en hypotese om 9:3:4 fordeling (udspaltning) giver en Goodness-of-fit-test på disse resultater en teststørrelse på 27.8 og en p-værdi på Biologen formoder, at der trods resultatet rent genetisk er tale om epistasi, så kan der findes andre faktorer, der forklarer resultatet? a) Overvej hvad der er population og hvad der er stikprøve i denne undersøgelse. b) Hvordan kan man biologisk forklare dette resultat? o Hvordan kan resultatet forklares med selektion? o Hvorfor giver det ikke mening at tale om F 1 og F 2 -generationer i naturen? o Hvorfor er hyppigheden af allelerne A, a, C og c ikke de samme i naturen, som de var i øvelse 9 og 10? Hvilken betydning har det for fordelingen af fænotyper? 11

13 Mendels resultater og forklaringer var tydelige og blev straks accepteret, da man genfandt hans arbejde omkring år Men Mendels krydsninger var jo styrede og selvbestøvninger bortset fra første krydsning. Som vi så i øvelse 11, så gælder Mendels udspaltningsforhold ikke nødvendigvis i naturen, og det fører os frem til det næste afsnit om Hardy-Weinberg-modellen. Hardy-Weinberg-modellen Efter Mendels resultater blev genopdaget var spørgsmålet, hvad der sker, når man har en population i naturen, hvor parring sker tilfældigt og hvor der ikke er lige mange af hvert allel. Hvordan vil fænotyper og genotyperne fordele sig? Og hvordan vil de udvikle sig i løbet af generationerne? Nogle af 1900-tallets førende biologer (og en del af nutidens elever :-) ) havde den tanke, at med tiden (mange generationer) vil dominerende egenskab blive mere og mere udbredte, og de recessive egenskaber ville forsvinde. En af de biologer, der undrede sig over problemet var R.C. Punnet og han henvendte sig derfor til sin ven fra cricketholdet, som var Englands førende matematiker G.H. Hardy. Denne gennemskuede, at man kan opstille en matematisk model for udspaltningen af et gen med 2 alleler. Han gjorde følgende antagelser: - vi har en temmelig stor population - der er tilfældigt parringsvalg - der ikke er forskel på kønnenes fordeling på genotyperne - alle genotyper er lige fertile Ud fra disse antagelser konkluderede han, at forholdet mellem de 3 genotyper vil være konstant fra generation til generation, og hvis frekvensen af allel A kaldes p og frekvensen af allel a kaldes q, da vil fordelingen af de 3 genotyper i næste generation være pp 2 2pppp qq 2. Dette er helt i overensstemmelse med Mendels forsøg, hvor p=q=0.5 og fordelingen mellem genotyperne var 0.25 : 0.5 : 0.25, svarende til fordelingen 1:2:1. Rigtigheden af resultatet kan vises ved en modificeret udgave af en Punnet square, vel at mærke under forudsætning af ovenstående betingelser. A allelfrekvens p A med allelfrekvens p AA med genotypefrekvens p 2 a allelfrekvens q Aa med genotypefrekvens pq a allelfrekvens q Aa med genotypefrekvens qp aa med genotypefrekvens q 2 Resultatet kan ses som brug af en kvadratsætning: (pp + qq) 2 = pp 2 + 2pppp + qq 2. 12

14 Øvelse 12 a) Hvor er hunnens alleler og hannens alleler præsenteret i skemaet (Punnet square)? b) Hvor mange forskellige fænotyper er der? c) Hvordan kommer multiplikationsprincippet til udtryk i tabellen? d) Hvorfor gælder det altid, at pp + qq = 1? e) Hvorfor gælder det altid, at pp 2 + 2pppp + qq 2 = 1? Brug af Hardy-Weinberg Selv om Hardy har udtalt, at Nothing I have ever done is of the slightest practical use, så optræder Hardy- Weinberg modellen i mange biologiske sammenhænge den dag i dag, og forekommer ofte i biologiopgaver. Omregning fra kendt pp og qq til fordeling af fænotyper Eksempel: Lad os gå tilbage til Mendels ærteplanter men nu som en naturlig population, der ikke selvbestøver, men krydsbestøves tilfældigt af insekter. Her var de to fænotyper rødviolet og hvid, hvor rødviolet var dominerende, og Mendel fandt udspaltningsforholdet 3: 1 i hans kontrollerede forsøg. Hvis der i naturen er en generation med 80% rødviolette alleler, dvs. pp = 0.8, og 20% hvide, dvs. qq = 0.2, hvordan vil fordelingen på genotyper og fænotyper så være i næste generation? Genotyperne AA, Aa og aa vil fordele sig som pp 2 2pppp qq 2 dvs , altså og det giver 96% rødviolette planter og kun 4% hvide. Denne fordeling er altså meget langt fra Mendels 3: 1 fordeling, selvom der stadig er tale om nedarvning, der følger Mendels principper eller love, som de i dag ofte omtales. Mendels kontrollerede krydsninger sikrede pp = 0.5 og qq = 0.5, og gav derfor fordelingen 3: 1. I dette eksempel er det præcis samme biologiske mekanismer, der gør sig gældende, men fordi pp og qq har andre værdier så bliver fordelingen en anden end den klassiske 3: 1. Øvelse 13 Undersøg om det er korrekt, at fordelingen af fænotyperne vil være 36% røde og 64% hvide planter, hvis vi har 20% rødviolette og 80% hvide alleler. Omregning fra fænotype til p og q, og tilbage til fænotype Fra 1. maj 2016 blev et screeningsprogram for sygdommen cystisk fibrose indført i Danmark. Cystisk fibrose er dermed den 17. sygdom som alle nyfødte screenes for ved analyse af en hælblodprøven. Men allerede inden et barn bliver født, kan man teste, om det bærer sygdommen. I det følgende afsnit vil vi tage udgangspunkt i sygdommen cystisk fibrose og et materiale man tidligere har givet til kommende forældre om sygdomme. Citater og fakta fra dette materiale vil være skrevet med kursiv. 13

15 Cystisk Fibrose Cystisk fibrose (CF) er en af de hyppigst forekommende arvelige lidelser i Vesteuropa og USA, med en incidens på ca. 1:4500. Det betyder, at der i befolkningsgrupperne er én med cystisk fibrose for hver 4500 mennesker. Øvelse 14 Cystisk fibrose (CF) er en autosomal recessiv sygdom med en fænotypehyppighed på 0,022 % i befolkningen. Hver gang man har 34 personer vil ca. én være bærer af genet for cystisk fibrose. Hvor kommer fænotypehyppigheden på 0.022% fra? Hvad angiver tallet ? Hvilke tal indgår i udregningen og hvad angiver tallet = 0.029? Hvordan hænger tallet og forholdet 1: 34 sammen? Benævn nu allelfrekvensen for det dominante gen C for pp og allelfrekvensen for det recessive gen c for qq, og husk de grundlæggende matematiske ligninger fra øvelse 12: pp + qq = 1 og pp 2 + qq 2 + 2pppp = 1 Hvilke værdier for pp, qq og 2pppp er det, der er beregnet ovenfor? I Danmark fødes børn om året. Eftersom CF er en recessiv autosomal sygdom så skal begge forældre være bærere af sygdomsgenet for at et barn kan fødes med CF. Beregn hvor mange børn der ca. fødes om året i Danmark med cystisk fibrose. Fra pjecen: I dag tilbyder man ikke anlægsbærere screening af gravide, selvom cystisk fibrose kategoriseres som en alvorlig sygdom, men man overvejer det. Det er nemlig sådan, at man ved den mest almindelige gentest kun finder ca. 90 % af CF-bærerne af personer med dansk afstamning. Derfor er der altså en vis sandsynlighed for, at man er bærer af sygdommen, selvom man er testet og fundet negativ. I befolkningen generelt er der er risiko på 1: 4500 for at få et barn med CF. Hvis én af forældrene screenes så reduceres risikoen til 1:45000 mens det vil være 1: hvis begge forældre screenes. Øvelse 15 a) Hvordan kan en screening resultere i en reduktion i antallet af fødte børn med CF? b) Hvordan er disse tal-forhold fremkommet? c) Man skønner, at der trods eventuelle screeninger vil blive født 1-2 børn med cystisk fibrose om året. Hvordan er man kommet frem til denne vurdering? Diskuter: d) Bør moderen og faderen have ens rettigheder m.h.t. gentest af deres ufødte barn? Har de det? e) Er gentests og screenings et godt tilbud eller et nødvendigt onde? For forældrene? For barnet? For samfundet? 14

16 Test af Hardy-Weinberg-ligevægt når pp og qq beregnes ud fra fænotyper Vi vil undersøge om vi ud fra en kendt genotypefordeling kan afgøre, om en population er i Hardy- Weinberg-ligevægt, altså om den følger Hardy-Weinberg-modellen. Eksempel med co-dominans hos frøer: Vi ser på en co-dominant egenskab med 2 alleler, som ses hos frøer. Vi har altså 3 fænotyper svarende til genotyperne LL, LM og MM og de fordeler sig med 133 LL, 135 LM og 72 MM i en stikprøve fra en bestemt population af frøer i Israel. Spørgsmålet er nu, om denne population er i Hardy-Weinberg-ligevægt. Først beregnes p som er frekvensen af allel L. Der er i alt 2 ( ) alleler, da hvert individ har 2 alleler. Antallet af L-alleler i populationen er , hvilket giver = = Helt 2 ( ) tilsvarende kan qq, som er frekvensen af allel M beregnes som qq = = eller nemmere 2 ( ) som qq = 1 p, da det gælder at pp + qq = 1. Hvis populationen er i Hardy-Weinberg-ligevægt, kan de forventede frekvenser af hver af genotyperne beregnes på følgende måde: LL: pp 2 = = , LM: 2 pp qq = = MM: qq 2 = = Da vi har set på i alt = 340 individer, ville vi have forventet en fordeling af genotyperne i stikprøven var LL LM MM Observeret i stikprøve Forventede værdier, hvis HW-ligevægt 340 0,3481 = 118, ,4838 = 164, ,1681 = 57,15 Det er tydeligt, at de forventede værdier afviger fra de observerede, men skyldes denne afvigelse tilfældig variation? Vores population er jo ikke uendelig stor, og de 340 undersøgte individer er tilmed en stikprøve af denne population, så selv om populationen er i HW-ligevægt, kan den undersøgte stikprøve godt afvige herfra. Om dette kan være tilfældet kan undersøges med en Goodness-of-fit-test. Vi har 3 observerede værdier og normalt sættes antallet af frihedsgrader til k-1, men i dette tilfælde bygger de forventede værdier på frekvenserne p og q, og da vi estimerer værdien af p eller q ud fra de observerede værdier, har vi kun 1 frihedsgrad. Dette vender vi tilbage til i afsnittet om frihedsgrader, hvor der gives en generel regel for antal frihedsgrader. Vi ser nu på resultatet af testen og 15

17 kan se, at sandsynligheden for den observerede fordeling i stikprøven, hvis populationen er i Hardy- Weinberg-ligevægt, er meget lille og langt under et signifikansniveau på 5%. Og vi kan derfor konkludere, at populationen næppe er i Hardy-Weinberg-ligevægt og at mindst en af de 4 ovenstående betingelser for Hardy-Weinberg-modellens gyldighed ikke er tilstrækkeligt opfyldt for denne population af frøer. Øvelse 16 a) Find Hardys 4 antagelser i afsnittet om Hardy-Weinberg-modellen. b) Hvilke afvigelser fra de 4 antagelser kan forklare forskellen mellem de forventede og de observerede værdier i eksemplet ovenfor? I dette eksempel har vi udregnet p og q ved at optælle alle alleler i stikprøven. Man kunne have estimeret p ved at antage Hardy-Weinberg-ligevægt og så sige pp = = og efterfølgende qq = 1 pp = 0.375, men dette er mindre korrekt og unødvendigt, når fordelingen af genotyperne er kendt. Som vi senere skal se med et eksempel med blodtyper, kan det ved være nødvendigt at estimere allelfrekvenser på denne måde, hvis kun fænotyperne og ikke genotyperne er kendt. Øvelse 17 Seglcelleanæmi er en sygdom hvor patienten har defekte røde blodlegemer og dermed nedsat evne til at transportere ilt. Sygdommen skyldes en genetisk defekt forårsaget af en ét-gens-mutation i genet for hæmoglobin, hvor det normale allel her vil blive betegnet H og det muterede allel H S. Mennesker med genotype H s H s dør, mens dem med genotype HH s lider af seglcelleanæmi, men er modstandsdygtige overfor malaria. Genotype Antal hos børn Antal hos voksne HH HH s H S H S 9 0 I alt Seglcelleanæmi hos en afrikansk population a) Bestem allelfrekvensen for H og H s for henholdsvis børn og voksne b) Er disse ens? Hvorfor / Hvorfor ikke? c) Er de voksne i Hardy-Weinberg-ligevægt? d) Er børnene i Hardy-Weinberg-ligevægt? e) Hvordan kan man ud fra beskrivelsen af seglcelleanæmi forklare forskellen mellem børn og voksne? Blodtyper - en case med både biologiske og matematiske pointer og præciseringer I det følgende vil blodtyperne ABO og Rhesus være omdrejningspunkt i opgaveregning og der er god mulighed for selv at lave nogle undersøgelser. 16

18 Dominans med 2 alleler og 2 fænotyper 85 % af befolkningen er rhesus positive (Rh+), dvs. 85 % af befolkningen har enten genotype Rr eller RR, da R-allelet dominerer over r-allelet. Dermed ved vi også, at 15 % af befolkningen er rhesus negative (Rh-) og har genotypen rr. Øvelse 18 a) Beregn allelfrekvensen qq for rr. b) Beregn allelfrekvensen pp for RR. c) Beregn 2pppp. d) Forklar, hvad tallet for 2pppp angiver. e) Beregn pp 2. f) Forklar, hvad tallet for pp 2 angiver. Hvis en gravid kvinde med genotypen Rh- venter et barn med genotypen Rh+, kan der opstå problemer med immunisering, såkaldt Rhesussyge. Moren kan i dette tilfælde danne antistoffer mod fosterets blod, hvilket kan give problemer for fosteret og det nyfødte barn kan fødes med svær blodmangel. Derfor undersøger man altid, om en gravid kvinde er Rh+ eller Rh-. Øvelse 19 a) Hvilken genotype har en Rh- kvinde? b) Hvilke genotyper kan hendes foster have? c) Hvilke genotyper kan faderen have og hvor hyppige er disse genotyper? d) Forklar, hvorfor ca. 60 % af Rh- gravide kvinder venter et Rh+ barn. Eksempel på blodtypeundersøgelse (HW med både 2 og 3-alleler) På et gymnasium undersøgte man blodtypefordelingen mht. Rhesus for to klasser og fik følgende resultater Rhesus positive elever Rhesus negative elever I alt Fordelingen af rhesusfaktor på to studieretninger på skolen. Fænotype: Blodtyper Rhesus positiv Rh+ Rhesus negativ Rh - Fordeling i DK 85 % 15 % Genotyper RR eller Rr rr Fordelingen af rhesusfaktor i den danske befolkning. 17

19 Øvelse 20 a) Vurder om elevernes blodtype fordeler sig som landsgennemsnittet ved at beregne de forventede værdier og se om der er overensstemmelse mellem de forventede og observerede værdier. OBS Det er der ikke, men før vi går videre, så er der brug for nogle vigtige overvejelser omkring population, stikprøve og mulige konklusioner. Hvis der ikke er overensstemmelse, så er der 3 mulige forklaringer: 1) Én forklaring er at tallene fra Blodbanken om fordelingen i DK er forkerte - det tror vi ikke på 2) En anden forklaring er, at der er tale om rene tilfældigheder i og med at stikprøven jo er en forholdsvis lille stikprøve. For at få svar på, om dette er den rigtige forklaring, så udfører vi et Goodness-of-fit-test, der netop tester om en afvigelse mellem en stikprøve og en forventet fordeling kan tilskrives tilfældigheder. Hvis p-værdien er større end signifikansniveauet, så kan afvigelsen tilskrives tilfældighed. 3) Hvis p-værdien derimod er under signifikansniveauet, så forkaster vi nulhypotesen om, at elevernes rhesusfordeling er den samme som landsgennemsnittet. Her bliver det så vigtigt at præcisere, hvilken population eleverne er en stikprøve for. Umiddelbart ville svaret være, at eleverne repræsenterer hele Danmark, men vi tror jo stadig ikke på, at tallene fra blodbanken er forkerte i og med de jo bygger på mange tusinde resultater. Derfor er svaret på, hvad der er undersøgelsens population, at eleverne er en stikprøve for borgerne i det pågældende lokalområde. Eleverne er ikke repræsentative i alder, men rent genetisk kan de måske være repræsentative for alle borgerne i lokalområdet. Konklusionen på det udførte GOF-test er derfor, at blodtypefordelingen i lokalområde tilsyneladende ikke har samme fordeling som hele befolkningen. Øvelse 21 Overvej hvilket lokalområde jeres klasse vil være repræsentativ for. Øvelse 22 Prøv at lave jeres egen undersøgelse og test om jeres lokalområde svarer til befolkningens fordeling. 3 alleler, dominans og codominans Vi vil nu se på AB0-systemet, hvor der er blodtyperne A, B, AB og 0 (tallet nul), som skyldes tre alleler: A, B og 0. Allelerne A og B er indbyrdes codominante, men begge dominerer over 0. Dette resulterer i følgende sammenhæng mellem genotyper og fænotyper: Genotype AA A0 BB B0 AB 00 Fænotype A A B B AB 0 18

20 Øvelse 23 a) Forklar i hvert af ovenstående 6 tilfælde, hvorfor genotypen giver den observerede fænotype. b) Når man siger en person har en given blodtypen, er det da genotypen eller fænotypen der menes? c) Hvilke genotyper kan forældrene til et barn med blodtype 0 have? d) Hvilke genotyper kan forældrene til et barn med blodtype A have? De 3 alleler er ikke lige hyppige og frekvensen af de 3 alleler A, B og 0 betegnes med bogstaverne p, q, og r og hvor det som altid gælder, at pp + qq + rr = 1 Hvis populationen er i Hardy-Weinberg-ligevægt så vil genotyperne have en bestemt fordeling. Denne kan man finde ved at lave et Punnet square lige som på side 12 eller simpelthen udregne frekvensen af hver af de 6 genotyper som kvadratet på en treleddet størrelse, (pp + qq + rr) 2 = pp 2 + 2pppp + qq 2 + 2qqqq + 2pppp + rr 2, hvor rækkefølgen er den samme som i tabellen herover. For hver af de 4 fænotyper fås altså følgende forventede frekvenser: Fænotype A B AB 0 Frekvens pp 2 + 2pppp qq 2 + 2qqqq 2pppp rr 2 Øvelse 24 Tabel 1: Blodtypernes fordeling, hvis der er Hardy-Weinberg-ligevægt. a) Hvis nogle allelfrekvenser i en given population er p = 0.31 og rr = 0.63, hvad er da q (frekvensen af B-allelen)? b) Hvad bliver frekvensen af de 4 blodtyper, hvis populationen er i Hardy-Weinberg-ligevægt? I den typiske situation kender man i en population fordelingen af blodtyperne, altså fænotyperne, men ikke allelfrekvenserne. Således er der i den danske befolkning følgende blodtypefordeling i procent: A 44%, B 10%, AB 5% og 0 41%. Disse fænotypefrekvenser vil vi betegne henholdsvis som freka, frekb, frekab og frek0. Hvad er så genotypefordelingen og allelfrekvenserne? Blodtypen 0 svarer kun til én genotype og herudfra kan r nemt beregnes: rr = ffffffff0 = 0.41 = 0.64 Det er dog vigtigt at pointere, at denne og de følgende beregninger alle forudsætter, at populationen er i Hardy-Weinberg-ligevægt. ffffffffff + ffffffff0 = (pp 2 + 2pppp) + rr 2 = pp 2 + 2pppp + rr 2 = (pp + rr) 2 Udnyttes også at pp + qq + rr = 1 kan q udregnes som: 19

21 qq = 1 (pp + rr) = 1 (pp + rr) 2 = 1 ffffffffff + ffffffff0 = = 0.08 Helt tilsvarende kan p beregnes som: pp = 1 (qq + rr) = 1 (qq + rr) 2 = 1 ffffffffff + ffffffff0 = = 0.29 Summen af frekvenserne er = Denne afvigelse kan skyldes enten afrundingsfejl eller at den danske population ikke er i Hardy-Weinberg ligevægt. Ved udregning af allelfrekvenserne bør man derfor kun udregne 2 af frekvenserne og så finde den sidste ud fra pp = 1 (qq + rr). Har man som herover estimeret en eller flere parametre i en model ud fra observerede værdier, har det betydning for antallet af frihedsgrader, hvis man efterfølgende vil teste om nogle observationer er i overensstemmelse med en fordeling, som f.eks. Hardy-Weinberg-fordelingen. Derfor følger nu et afsnit om antallet af frihedsgrader. Frihedsgrader Når man bruger chi-i-anden-fordelingen til at udregne p-værdien, der jo er sandsynligheden for den observerede teststørrelse eller noget mere ekstremt, indgår antallet af frihedsgrader. I den almindelige matematikundervisning er reglen herom, at der er kk 1 frihedsgrader ved GOF-test og (ss 1) (rr 1) frihedsgrader ved uafhængighedstest. Her er kk antallet af observationskategorier og ss og rr er antallet af henholdsvis søjler og rækker i den tabel, der laves uafhængighedstest på. Dette er korrekt og tilstrækkeligt ved den type opgaver der indgår ved eksamen i matematik. Men i andre sammenhænge, herunder når GOF-test anvendes i biologiske sammenhænge er der brug for en mere generel regel for antallet af frihedsgrader. Denne er aaaaaaaaaa ffffffheeeeeeeeeeeeeeeeee = kk cc 1 hvor k stadig er det samlede antal kategorier og c er antallet af parametre der estimeres ud fra de observerede data og indgår i udregningen af de forventede værdier. Lad os se på nogle eksempler med forskellige frihedsgrader: - Når man kaster en terning 60 gange og noterer antal gange hvert af de 6 mulige udfald indtræffer, er der 5 frihedsgrader, hvis nulhypotesen er, at alle udfald er lige hyppige (terningen er ærlig). Vi har 6 kategorier (antal ettere, antal toere ), vi estimerer ingen parametre og vi får derfor 6-0-1=5 frihedsgrader. Dette passer med, at hvis vi kender 5 af tallene kan den sidste udregnes, da totalen jo skal være 60 for både de observerede og de forventede værdier. Dette er den intuitive opfattelse af frihedsgrader - Hvis vi nu forestiller os en særlig terning, hvor de 6 sider ikke er lige store, og hvor de forskellige udfald derfor ikke er lige hyppige. Producenten oplyser, at sandsynligheden for udfaldene er en lineær funktion af antal øjne, og vi vil gerne teste om denne hypotese holder. Vi kaster terningen 60 gange og får følgende fordeling: 20

22 Antal øjne Observeret antal For at teste om tallene fordeler sig lineært, må vi estimere både en a og en b-værdi, så vi kan udregne de forventede værdier. Hvordan vi estimerer har ingen betydning for antallet af frihedsgrader. Vi kunne f.eks. beregne aa = ssssssssssss fførrrrrrrr aaaaaaaaaa tttttttt = = 2 og bb = fførrrrrrrr vværrrrrr aa = 5 2 = 3. Vi kunne også have lavet lineær regression, hvilket havde givet nogle lidt andre og bedre værdier for a og b. Men uanset hvordan vi estimerer a og b kan vi beregne de 6 forventede værdier og med en GOF-test teste om de observerede værdier er i overensstemmelsen med nulhypotesen om en lineær fordeling. Selv om vi har 6 observerede værdier, skal vi teste med 3 frihedsgrader, da antal frihedsgrader i dette tilfælde er = 3. Når der er færre frihedsgrader, fordi vi estimerer parametre, vil teststørrelsen automatisk blive mindre, da de forventede værdier jo kommer tættere på de observerede værdier. Den kritiske værdi skal derfor være lavere, hvis resultatet af testet skal være det samme, og det sker netop ved en chi-i-anden-fordelingen med et lavere antal frihedsgrader. Se grafen herunder: Øvelse 25 Lav en GOF-test, for at teste om sandsynligheden for terningens udfald er en lineær funktion af antallet af øjne. - Et mere biologisk eksempel er at vi vil undersøge om der er Hardy-Weinberg ligevægt, men ikke kender allelfrekvenserne. Vi observerer måske på en eng 16 lyseblå og 78 mørkeblå varianter af en blomst. Hvis vi antager at der er tale om et enkelt gen med 2 alleler, der styrer denne farveforskel og at mørkeblå dominerer over lyseblå og at der er HW-ligevægt, så må 16 = pp 2 aaaaaaaaaa og vi kan 21

23 estimere pp = 16 = og qq = 1 pp = Den forventede værdi af de lyseblå bliver så ( ) = 16. Men hov, det passer jo perfekt. Betyder det at planten er i HW-ligevægt? Nej, for vi har aaaaaaaaaa ffffffheeeeeeeeeeeeeeeeee = = 0. Når vi kun har 2 observationer og så estimerer en parameter, så vil tallene altid passe og vi kan ikke undersøge om der er HW-ligevægt. For det antog vi jo i udregningen af allelfrekvensen at der var! - Vi så tidligere på eksempel med en codominant egenskab hos en population af frøer. Her havde vi 3 fænotyper og derfor 3 observerede antal. Men for at beregne de forventede værdier ved HWligevægt, måtte p estimeres ud fra de observerede antal og derfor blev antallet af frihedsgrader = 1. Vi estimerede også q, men da det gælder at pp + qq = 1, behøver denne ikke estimeres ud fra de observerede værdier, og derfor fratrækkes kun for én estimeret parameter. - I eksemplet med blodtyperne havde vi 4 fænotyper og ud fra disse estimerede vi de 2 allelfrekvenser. Den sidste frekvens blev beregnet som pp = 1 (qq + rr), og blev derfor ikke estimeret ud fra de observerede værdier. Derfor vil en testning for Hardy-Weinberg-ligevægt have = 1 frihedsgrad. På side ser vi på en eksamensopgave, hvor antallet af frihedsgrader bør diskuteres/overvejes ud fra såvel matematiske som biologiske overvejelser. Hardy-Weinberg forudsætninger i dag I dag anfører man ofte flere forudsætninger end Hardy gjorde, nemlig: Arten er diploid. Tilfældig parring, dvs., at forældrene til alle individer er tilfældigt udvalgt fra den foregående generation. Uendelig populationsstørrelse; i praksis kræves, at man kan se bort fra tilfældige fluktuationer. Ingen migration, så næste generations genetiske sammensætning afspejler foregående generations genetiske sammensætning Ingen selektion, så den næste generation har samme genetiske sammensætning som foregående generation. Ikke-overlappende generationer. Ingen mutation. (Kilde: Hardy-Weinberg-loven, Wikipedia, maj 2017, 22

24 Øvelse 26 a) Overvej hvorfor ovenstående betingelser er en forudsætning for, at den matematiske model holder. (Nogle er nemme, andre meget svære at forklare) b) Overvej hvorfor følgende populationer ikke nødvendigvis er i Hardy-Weinberg-ligevægt: - Løveflok - Egern på en lille ø - Plante ved afløb fra atomkraftværk - Mennesker c) Overvej om der findes populationer (dyr/planter), der ikke er underlagt selektion? d) Overvej hvorfor Hardy-Weinberg-modellen er en meget anvendt biologisk model, selvom alle betingelserne ikke altid/aldrig er opfyldt? Eksamensopgaver På de følgende sider er der uddrag 3 gamle eksamensopgaver fra Biologi A, hvor omdrejningspunktet er Hardy-Weinberg-ligevægt og/eller p-værdi. Biologi A Vejledende sæt Opgave 3 Shakere Shaker-genets arvegang er bestemt ved følgende krydsningsforsøg: Shaker-hanner blev krydset med normale, homozygote hunner. I F1-generationen var alle hanner normale, og alle hunner var Shakere. Efter tilfældig parring i F1-generationen talte man fordelingen af individer op for de fire fænotyper i F2- generationen. Resultaterne fremgår af tabellen: Observeret antal individer i F2-generationen Shakerhanner 136 Normale hanner 131 Shakerhunner 132 Normale hunner 137 Ialt 536 Figur 1: Fordeling af individer på fænotyper i F2-generationen 1. Angiv den sandsynlige arvegang for Shaker-egenskaben. Begrund dit svar. Ved en χ 2 -test har man undersøgt, om antallet af individer i F2-generationen er jævnt fordelt på de fire fænotyper. Resultatet fremgår af Figur 2: 23

25 Observeret antal i F2- generationen (O) Forventet antal på baggrund af H 0 - hypotesen (F) (OO FF) 2 Shakerhanner Normale hanner Shakerhunner Normale hunner Ialt Χ 2 -værdi: P-værdi: Figur 2: Resultater fra χ2 test på baggrund af følgende H0 -hypotese: Antallet af individer i F2-generationen er jævnt fordelt på de fire fænotyper. FF 2. Vurder, om χ 2 -testen underbygger den foreslåede arvegang (Inddrag figur 2) Biologi, August 2015 Opgave 3 Indavl hos bananfluer (Dele af) Bananfluen, Drosophila melanogaster, se figur 1, er velegnet til genetiske undersøgelser En gymnasieklasse har udført et eksperiment med bananfluer. Formålet var at undersøge om indavl påvirker bananfluers evne til at modstå høje temperaturer. 1. Giv et forslag til, hvordan man frembringer en population af indavlede bananfluer. Eksperimentet blev udført på en indavlet og en ikke-indavlet population af bananfluer. Bananfluerne blev udsat for varmestress i 60 minutter. Herefter blev antallet af bananfluer i koma og antal aktive bananfluer optalt. 24

26 I eksperimentet blev følgende hypotese opstillet: H 0 : Der er ingen forskel på andelen af bananfluer i koma hos indavlede bananfluer og ikke-indavlede bananfluer efter varmestress. H A : Der er forskel på andelen af bananfluer i koma hos indavlede og ikke-indavlede bananfluer efter varmestress Figur 2 viser resultaterne fra eksperimentet samt statistiske beregninger Observerede Aktive Koma Forventede Aktive Koma Aktive (OO FF) 2 FF Koma Samlet test-værdi og p-værdi Indavlede Χ 2 =6.54 Ikkeindavlede P=0.01 Total Figur 2: Resultater samt statistiske beregninger. 2. Vurdér, hvillken af de to hypoteser H 0 eller H A, der bliver bekræftet af resultaterne, vist i figur 2. Biologi, August 2017 Opgave 4 Hjernemalaria (Dele af) Malaria skyldes infektion med malariaparasitter af slægten Plasmodium. Parasitten overføres fra myg til menneske. Forskere har undersøgt, om genet RNASE3 har betydning for, om smittede udvikler den dødelige hjernemalaria. Hos mennesket findes to alleler af RNASE3- genet: R1 og R2. I den ene variant findes et G på position 371 i en triplet, som koder for aminosyren arginin. I den anden variant findes et C på position 371 i en triplet, som koder for aminosyren threonin. Figur 1 viser tripletter, som koder for henholdsvis arginin og thre- onin. Tripletter som koder for arginin CGT CGC CGA CGG AGA AGG Figur 1. Tripletter som koder for arginin og threonin. Tripletter som koder for threonin ACT ACC ACA ACG 25

27 1. Angiv en triplet for arginin, som ved én punktmutation i stedet koder for threonin. Anvend figur 1. Begrund dit svar. En gruppe forskere har bestemt genotyperne hos malariasmittede børn fra Ghana og raske danskere. Figur 2 viser fordelingen af de tre genotyper. Genotype Børn fra Ghana med Raske danskere hjernemalaria R1R R1R R2R I alt Figur 2. Observerede antal individer fordelt på de tre genotyper. 2. Beregn allelfrekvensen for R1 og R2 i hver af de to undersøgte grupper. Vis dine beregninger. 26

28 Ud fra allelfrekvenserne kan antal forventede individer fordelt på de tre genotyper, beregnes. Resultaterne blev testet med en χχ 2 test, hvor H 0 -hypotesen var, at populationen er i Hardy-Weinberg-ligevægt. 0 Resultatet fremgår af figur 3. Ved χχ 2 -test fås p = 0,0002 for den ghanesiske population og p = 0,1074 for den danske population. Genotypes Observerede ghanesiske børn med hjernemalaria Forventede ghanesiske børn med hjernemalaria R1R ,39 1,54 R1R ,22 7,29 R2R ,39 8,65 (OO (OO FF) FF) 2 FF FF Antal i alt ,00 χχ 2 =17,48; p = 0,0002 Genotypes Observerede danskere Forventede danskere R1R ,73 2,22 R1R ,53 1,86 R2R ,73 0,39 Antal i alt ,99 χχ 2 =4,46; p = 0,1074 (OO FF) 2 FFFF Figur 3. Observeret samt forventet antal individer fordelt på genotyper under forudsætning af Hardy-Weinberg-lige- vægt. 3. Vurder, om den ghanesiske og om den danske population er i Hardy-Weinberg-lige-vægt, hvis signifikansniveauet sættes til 5 %. Begrund dit svar. Vigtigt. De oplyste p-værdier er beregnet ud fra, at antallet af frihedsgrader er 2. Det ville også være det antal man umiddelbart kom frem til ved at bruge formlen aaaaaaaaaa ffffffheeeeeeeeeeeeeeeeee = kk 1 som normalt bruges ved en Goodness-of-fit-test. Men i denne sammenhæng er der tale om en GOF-test i en anvendt (biologisk) sammenhæng og der er derfor brug for den mere generelle regel for antallet af frihedsgrader: aaaaaaaaaa ffffffheeeeeeeeeeeeeeeeee = kk cc 1. k er som nævnt tidligere det samlede antal kategorier og c er antallet af parametre, der estimeres ud fra de observerede data og indgår i udregningen af de forventede værdier. I denne opgave burde antallet af frihedsgrader derfor være: aaaaaaaaaa ffffffheeeeeeeeeeeeeeeeee = = 1. 27

29 2 frihedsgrader 1 frihedsgrad Som det fremgår af de to ovenstående grafer så får man forskellige p-værdier når der regnes med henholdsvis 1 frihedsgrad og 2 frihedsgrader. Med 2 frihedsgrader skal hypotesen om, at populationen er i H-W-ligevægt accepteres mens den med 1 frihedsgrad skal forkastes! Dette passer netop med det der tidligere blev forklaret i ansnittet om frihedsgrader. Når der estimeres parametre, er der færre frihedsgrader, og så bliver p-værdierne lavere. Dette betyder, at ved 2 frihedsgrader accepteres, at de danske børn er i Hardy-Weinberg-ligevægt, mens der ved 1 frihedsgrad konkluderes, at de ikke er i Hardy-Weinberg-ligevægt. Det er den sidste konklusion, der er den korrekte. Til den skriftlige biologieksamen skal man ikke selv udregne p-værdier, men kun kunne tolke hvad de(n) fortæller om en given nulhypotese. Derfor vil sådanne kontrol-beregninger af oplyste teststørrelser og/eller p-værdier aldrig blive aktuelle til biologieksamen. Og man skal altid anvende opgavens oplyste værdier frem for egne udregnede værdier, selv om man mener de sidste er mere korrekte. Til den skriftlige eksamen i matematik vil man aldrig skulle forholde til biologisk indhold, uanset hvilken studieretning man har, og man skal også der selvfølgelig kun tage udgangspunkt i de oplyste værdier. 28

30 Appendiks A udregninger i Maple 29

31 30

32 31

33 32

34 33

35 34

36 Data: Fysiologiske målinger Resultatskema til fysiologiske målinger Hold: 1.w Puls Hvilepuls Puls efter Højde Vægt BMI Taljemål Hoftemål Talje/hofte Puls Blodtryk Fingerstyrke Hoppe- Vitalafslappet (hjemme) arbejde forhold siddende systolisk diastolisk venstre højre højde kapacitet Navn: slag/min slag/min slag/min m kg kg/m² cm cm slag/min mmhg mmhg N N cm L Dreng ,840 64,0 18,9 73,0 85,0 0,86 66,00 117,00 64,00 262,80 296,80 36,00 3,30 Dreng ,770 65,0 20,7 73,0 83,0 0,88 70,00 103,00 59,00 353,00 335,00 36,00 4,10 Dreng ,810 69,0 21,1 83,0 97,0 0,86 97,00 119,00 60,00 199,60 203,60 26,00 3,80 Dreng ,820 77,8 23,5 79,0 99,0 0,80 90,00 138,00 75,00 235,00 226,00 37,00 3,00 Dreng ,960 81,0 21,1 84,0 94,0 0,89 57,00 118,00 64,00-347,00 67,00 4,10 Dreng ,890 82,0 23,0 77,0 102,0 0,75 75,00 112,00 62,00 337,00 17,17 45,00 4,50 Dreng ,825 69,1 20,7 71,0 96,0 0,74 98,00 124,00 81,00 248,40 282,00 42,00 3,70 Dreng ,910 83,5 22,9 86,0 97,0 0,89 61,00 107,00 70,00 359,00 456,00 65,00 4,00 Dreng ,680 64,0 22,7 73,0 84,0 0,87 76,00 100,00 66,00 270,00 360,00 34,00 3,50 Dreng , ,6 77,0 91,0 0, ,1 Dreng , ,0 79,0 91,0 0, ,6 Dreng , ,1 81,0 93,0 0, ,4 Dreng ,850 71,5 20, , ,2 415,7 50 2,8 Dreng ,795 67,8 21,0 82,6 91,2 0,91 69,00 111,00 66,00 311,70 324,00 41,60 4,70 Dreng ,710 59,5 20,3 70,0 75,0 0,93 60,00 90,00 61,00 291,00 320,00 28,00 3,50 Dreng ,770 53,0 16,9 57,0 64,0 0,89 99,00 120,00 83,00 250,00 260,00 38,00 3,20 Dreng ,850 70,0 20,5 84,0 90,0 0,93 99,00 117,00 73,00 260,00 260,00 30,00 4,10 Dreng ,810 73,2 22,3 81,0 94,0 0,86 89,00 105,00 55,00 342,40 413,50 0,00 3,50 Dreng ,780 77,5 24,5 81,0 97,0 0,84 76,00 121,00 64,00 435,50 505,70 50,00 4,10 Dreng ,860 70,0 20,2 77,0 87,0 0,89 80,00 110,00 80,00 320,00 350,00 60,00 4,50 Dreng ,827 77,0 23,1 78,0 88,0 0,89 82,00 121,00 51,00 340,00 430,00 50,00 4,40 Gns. drenge ,795 68,7 21,3 76,8 88,0 0, ,0 360,3 37,66 3,9 Pige ,665 50,00 18,04 62,00 89,00 0,70 81,00 121,00 77,00 179,60 197,60 70,50 2,90 Pige ,675 50,50 18,00 63,50 89,00 0,71 70,00 99,00 63,00 155,30 222,40 72,50 3,00 Pige ,640 59,00 21,94 69,00 95,00 0,73 77,00 137,00 80,00 190,00 194,90 19,50 2,50 Pige ,765 65,00 20,87 66,00 96,00 0,69 74,00 109,00 84,00 235,50 218,80 28,50 2,90 Pige ,620 47,70 18,18 65,00 79,00 0,82 87,00 107,00 75,00 177,00 211,00 38,50 2,30 Pige ,655 52,50 19,17 65,00 79,00 0,82 84,00 112,00 78,00 161,00 206,00 34,00 3,00 Pige ,630 51,00 19,20 61,00 68,00 0,90 69,00 113,00 79,00 246,00 279,90 41,00 3,00 Pige ,665 56,50 20,38 68,00 91,00 0,75 69,00 114,00 73,00 133,50 139,70 25,00 2,60 Pige ,760 58,00 18,72 64,00 96,00 0,67 60,00 116,00 62,00 196,40 205,10 16,00 2,90 Pige ,740 65,30 21,57 69,00 86,00 0,80 68,00 125,00 77,00 217,90 182,70 29,00 2,70 Pige ,740 62,50 20,64 76,00 89,00 0,85 84,00 104,00 70,00 197,80 247,50 34,00 3,10 Pige ,572 50,10 20,27 66,00 78,00 0,85 74,00 107,00 72,00 172,10 173,50 35,00 2,60 Pige ,660 54,20 19,60 70,00 83,00 0,84 76,00 97,00 70,00 233,20 250,60 35,00 2,70 Pige ,740 66,10 21,83 71,00 97,00 0,73 83,00 96,00 68,00 225,90 246,70 35,00 3,50 Pige ,695 70,00 24,36 75,00 91,00 0,82 73,00 131,00 72,00 218,10 263,90 24,00 3,40 Pige ,710 62,50 21,37 77,00 86,00 0,90 74,00 134,00 75,00 265,10 269,50 34,00 3,40 Pige ,560 46,00 18,90 63,50 72,00 0,88 83,00 116,00 89,00 202,60 204,00 33,00 2,30 Pige ,500 39,20 17,42 64,00 76,00 0,84 75,00 101,00 65,00 163,40 159,90 27,00 2,10 Pige ,725 56,50 18,99 60,00 91,00 0,66 83,00 117,00 66,00 240,00 290,00 31,50 1,20 Pige ,710 57,50 19,66 70,00 95,00 0,74 75,00 112,00 60,00 215,20 237,60 38,00 2,60 Pige ,610 64,00 24,69 77,00 101,00 0,76 69,00 109,00 68,00 257,90 298,10 35,00 2,70 Pige ,700 54,20 18,75 68,00 93,00 0,73 75,00 109,00 68,00 227,80 221,20 30,00 1,70 Pige ,750 68,00 22,20 81,00 104,00 0,78 55,00 106,00 62,00 227,80 264,90 25,00 3,50 Pige ,715 58,00 19,72 66,50 91,00 0,73 67,00 105,00 67,00 239,00 309,00 31,00 2,50 Pige ,690 66,00 23,11 73,00 104,00 0,70 65,00 124,00 83,00 220,00 225,00 25,00 2,30 Pige ,580 58,00 23,23 76,00 94,00 0,81 53,00 128,00 64,00 224,00 231,00 36,50 2,90 Pige ,650 51,50 18,92 64,00 91,00 0,70 84,00 104,00 73,00 203,00 204,00 32,00 3,10 Pige ,680 67,00 23,70 73,00 97,00 0,75 68,00 121,00 74,00 288,80 235,90 42,00 2,90 Pige ,620 55,00 20,96 67,00 92,00 0,73 82,00 120,00 74,00 228,00 270,00 34,00 2,50 Pige ,680 63,00 22,32 72,00 97,00 0,74 72,00 117,00 69,00 260,00 275,00 44,00 3,50 Pige ,680 71,00 25,16 84,00 108,00 0,78 73,00 125,00 71,00 201,00 217,00 29,00 2,40 Pige ,680 57,70 20,44 70,00 92,00 0,76 49,00 133,00 62,00 200,00 210,00 40,00 3,80 Pige ,815 68,50 20,79 79,00 101,00 0,78 73,00 111,00 67,00 260,00 310,00 48,00 3,30 Pige ,700 62,50 21,63 68,00 98,00 0,69 80,00 114,00 72,00 245,00 240,00 41,00 3,30 Gns. piger ,687 61,15 21,52 71,78 96,81 0, ,6 252,4 35,13 2,76 35

Et eksempel: Blomsterpopulation med to co-dominante gener for kronbladenes farve

Et eksempel: Blomsterpopulation med to co-dominante gener for kronbladenes farve Populationsgenetik I populationsgenetik beskæftiger man sig med at undersøge hyppigheden af forskellige gener samt fordeligen af fænotyper og genotyper i forskellige populationer. For en ordens skyld:

Læs mere

MATEMATIK A-NIVEAU. Anders Jørgensen & Mark Kddafi. Vejledende eksempler på eksamensopgaver og eksamensopgaver i matematik, 2012

MATEMATIK A-NIVEAU. Anders Jørgensen & Mark Kddafi. Vejledende eksempler på eksamensopgaver og eksamensopgaver i matematik, 2012 MATEMATIK A-NIVEAU Vejledende eksempler på eksamensopgaver og eksamensopgaver i matematik, 2012 Kapitel 4 Statistik & sandsynlighedsregning 2016 MATEMATIK A-NIVEAU Vejledende eksempler på eksamensopgaver

Læs mere

Projekt 9.4 Darwins, Mendels og Hardy Weinbergs arvelighedslove

Projekt 9.4 Darwins, Mendels og Hardy Weinbergs arvelighedslove Projekt 9.4 Darwins, endels og Hardy Weinbergs arvelighedslove (Projektet kan indgå som en del af et studieretningssamarbejde. Vores definition af sandsynligheder er enten empirisk begrundet eller eksperimentelt

Læs mere

Cellens livscyklus GAP2. Celledeling

Cellens livscyklus GAP2. Celledeling Cellens livscyklus Cellens livscyklus inddeles i to faser, interfase og mitose. GAP1 (G1). Tiden lige efter mitosen hvor der syntetiseres RNA og protein. Syntese fasen. Tidsrummet hvor DNAet duplikeres

Læs mere

CMU PROJEKT HYPOTESETEST OG SIMULERING MICHAEL AGERMOSE JENSEN CHRISTIANSHAVNS GYMNASIUM

CMU PROJEKT HYPOTESETEST OG SIMULERING MICHAEL AGERMOSE JENSEN CHRISTIANSHAVNS GYMNASIUM CMU PROJEKT HYPOTESETEST OG SIMULERING MICHAEL AGERMOSE JENSEN CHRISTIANSHAVNS GYMNASIUM FORMÅL - BEKENDTGØRELSEN STX MATEMATIK A Kompetencer anvende simple statistiske eller sandsynlighedsteoretiske modeller

Læs mere

Bananfluer og nedarvning

Bananfluer og nedarvning Bananfluer og nedarvning Teori: Bananflue-genetik Bananfluens livscyklus Bananfluen, Drosophila melanogaster, har været brugt til at studere genetik i mere end 100 år. Denne diploide organisme har fuldstændig

Læs mere

2 -test. Fordelingen er særdeles kompleks at beskrive med matematiske formler. 2 -test blev opfundet af Pearson omkring år 1900.

2 -test. Fordelingen er særdeles kompleks at beskrive med matematiske formler. 2 -test blev opfundet af Pearson omkring år 1900. 2 -fordeling og 2 -test Generelt om 2 -fordelingen 2 -fordelingen er en kontinuert fordeling, modsat binomialfordelingen som er en diskret fordeling. Fordelingen er særdeles kompleks at beskrive med matematiske

Læs mere

Deskriptiv statistik for hf-matc

Deskriptiv statistik for hf-matc Deskriptiv statistik for hf-matc 75 50 25 2018 Karsten Juul Deskriptiv statistik for hf-matc Hvad er deskriptiv statistik? 1.1 Hvad er deskriptiv statistik?... 1 1.2 Hvad er grupperede og ugrupperede data?...

Læs mere

Genetisk drift og naturlig selektion

Genetisk drift og naturlig selektion Genetisk drift og naturlig selektion Denne vejledning indeholder en gennemgang af simulationsværktøjer tilgængeligt online. Værktøjerne kan bruges til at undersøge effekten af populationsstørrelse på genetisk

Læs mere

for gymnasiet og hf 2017 Karsten Juul

for gymnasiet og hf 2017 Karsten Juul for gymnasiet og hf 75 50 5 017 Karsten Juul Statistik for gymnasiet og hf 017 Karsten Juul 5/11-017 Nyeste version af dette hæfte kan downloades fra http://mat1.dk/noter.htm Hæftet må benyttes i undervisningen

Læs mere

for gymnasiet og hf 2016 Karsten Juul

for gymnasiet og hf 2016 Karsten Juul for gymnasiet og hf 75 50 5 016 Karsten Juul Statistik for gymnasiet og hf Ä 016 Karsten Juul 4/1-016 Nyeste version af dette håfte kan downloades fra http://mat1.dk/noter.htm HÅftet mç benyttes i undervisningen

Læs mere

J E T T E V E S T E R G A A R D

J E T T E V E S T E R G A A R D BINOMIALT EST J E T T E V E S T E R G A A R D F I P B I O L O G I M A R S E L I S B O R G G Y M N A S I U M D. 1 3. M A R T S 2 0 1 9 K A L U N D B O R G G Y M N A S I U M D. 1 4. M A R T S 2 0 1 9 HVEM

Læs mere

Lineære sammenhænge, residualplot og regression

Lineære sammenhænge, residualplot og regression Lineære sammenhænge, residualplot og regression Opgave 1: Er der en bagvedliggende lineær sammenhæng? I mange sammenhænge indsamler man data som man ønsker at undersøge og afdække eventuelle sammenhænge

Læs mere

for matematik pä B-niveau i hf

for matematik pä B-niveau i hf for matematik pä B-niveau i hf 75 50 5 016 Karsten Juul GRUPPEREDE DATA 1.1 Hvad er deskriptiv statistik?...1 1. Hvad er grupperede og ugrupperede data?...1 1.1 Eksempel pä ugrupperede data...1 1. Eksempel

Læs mere

Lars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ 2 -test og Goodness of Fit test.

Lars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ 2 -test og Goodness of Fit test. Lars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ -test og Goodness of Fit test. Anvendelser af statistik Statistik er et levende og fascinerende emne, men at læse om det er alt

Læs mere

Kvægavlens teoretiske grundlag

Kvægavlens teoretiske grundlag Kvægavlens teoretiske grundlag Lige siden de første husdyrarter blev tæmmet for flere tusinde år siden, har mange interesseret sig for nedarvningens mysterier. Indtil begyndelsen af forrige århundrede

Læs mere

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven. PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve

Læs mere

Deskriptiv statistik for matc i stx og hf

Deskriptiv statistik for matc i stx og hf Deskriptiv statistik for matc i stx og hf 75 50 25 2019 Karsten Juul Deskriptiv statistik for matc i stx og hf Hvad er deskriptiv statistik? 1.1 Hvad er deskriptiv statistik?... 1 1.2 Hvad er grupperede

Læs mere

I. Deskriptiv analyse af kroppens proportioner

I. Deskriptiv analyse af kroppens proportioner Projektet er delt i to, og man kan vælge kun at gennemføre den ene del. Man kan vælge selv at frembringe data, fx gennem et samarbejde med idræt eller biologi, eller man kan anvende de foreliggende data,

Læs mere

Løsning til opgave 7, 9, 10 og 11C Matematik B Sommer 2014

Løsning til opgave 7, 9, 10 og 11C Matematik B Sommer 2014 Vejledning til udvalgte opgave fra Matematik B, sommer 2014 Opgave 7 Størrelsen og udbudsprisen på 100 fritidshuse på Rømø er indsamlet via boligsiden.dk. a) Grafisk præsentation, der beskriver fordelingen

Læs mere

Personlig stemmeafgivning

Personlig stemmeafgivning Ib Michelsen X 2 -test 1 Personlig stemmeafgivning Efter valget i 2005 1 har man udspurgt en mindre del af de deltagende, om de har stemt personligt. Man har svar fra 1131 mænd (hvoraf 54 % har stemt personligt

Læs mere

c) For, er, hvorefter. Forklar.

c) For, er, hvorefter. Forklar. 1 af 13 MATEMATIK B hhx Udskriv siden FACITLISTE TIL KAPITEL 7 ØVELSER ØVELSE 1 c) ØVELSE 2 og. Forklar. c) For, er, hvorefter. Forklar. ØVELSE 3 c) ØVELSE 4 90 % konfidensinterval: 99 % konfidensinterval:

Læs mere

Løsning til eksaminen d. 14. december 2009

Løsning til eksaminen d. 14. december 2009 DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,

Læs mere

χ 2 -test i GeoGebra Jens Sveistrup, Gammel Hellerup Gymnasium

χ 2 -test i GeoGebra Jens Sveistrup, Gammel Hellerup Gymnasium χ 2 -test i GeoGebra Jens Sveistrup, Gammel Hellerup Gymnasium Man kan nemt lave χ 2 -test i GeoGebra både goodness-of-fit-test og uafhængighedstest. Den følgende vejledning bygger på GeoGebra version

Læs mere

Matematik A. Studentereksamen. Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet

Matematik A. Studentereksamen. Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet Matematik A Studentereksamen Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet stx11-matn/a-080501 Tirsdag den 8. maj 01 Forberedelsesmateriale til stx A Net MATEMATIK Der

Læs mere

Vejledende eksamensopgaver vedr. hypotesetest (stx B og stx A)

Vejledende eksamensopgaver vedr. hypotesetest (stx B og stx A) Vejledende eksamensopgaver vedr. hypotesetest (stx B og stx A) Opgave 1 I nedenstående tabel ses resultaterne af samtlige hjerteklapoperationer i 007-08 ved Odense Universitetshospital (OUH) sammenlignet

Læs mere

Schweynoch, 2003. Se eventuelt http://www.mathematik.uni-kassel.de/~fathom/projekt.htm.

Schweynoch, 2003. Se eventuelt http://www.mathematik.uni-kassel.de/~fathom/projekt.htm. Projekt 8.5 Hypotesetest med anvendelse af t-test (Dette materiale har været anvendt som forberedelsesmateriale til den skriftlige prøve 01 for netforsøget) Indhold Indledning... 1 χ -test... Numeriske

Læs mere

Flemmings Maplekursus 1. Løsning af ligninger

Flemmings Maplekursus 1. Løsning af ligninger Flemmings Maplekursus 1. Løsning af ligninger a) Ligninger med variabel og kun en løsning. Ligningen løses 10 3 Hvis vi ønsker løsningen udtrykt som en decimalbrøk i stedet: 3.333333333 Løsningen 3 er

Læs mere

Statistik II 1. Lektion. Analyse af kontingenstabeller

Statistik II 1. Lektion. Analyse af kontingenstabeller Statistik II 1. Lektion Analyse af kontingenstabeller Kursusbeskrivelse Omfang 5 kursusgange (forelæsning + opgaveregning) 5 kursusgange (mini-projekt) Emner Analyse af kontingenstabeller Logistisk regression

Læs mere

Statistik. Peter Sørensen: Statistik og sandsynlighed Side 1

Statistik. Peter Sørensen: Statistik og sandsynlighed Side 1 Statistik Formålet... 1 Mindsteværdi... 1 Størsteværdi... 1 Ikke grupperede observationer... 2 Median og kvartiler defineres ved ikke grupperede observationer således:... 2 Middeltal defineres ved ikke

Læs mere

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06)

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06) Afdeling for Biostatistik Bo Martin Bibby 23. november 2006 Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06) Vi betragter 4699 personer fra Framingham-studiet. Der er oplysninger om follow-up

Læs mere

(Projektets første del er rent deskriptiv, mens anden del peger frem mod hypotesetest. Projektet kan gemmes til dette emne, eller tages op igen der)

(Projektets første del er rent deskriptiv, mens anden del peger frem mod hypotesetest. Projektet kan gemmes til dette emne, eller tages op igen der) Projekt 2.4 Menneskets proportioner (Projektets første del er rent deskriptiv, mens anden del peger frem mod hypotesetest. Projektet kan gemmes til dette emne, eller tages op igen der) I. Deskriptiv analyse

Læs mere

Analyse af en lineær regression med lav R 2 -værdi

Analyse af en lineær regression med lav R 2 -værdi Analyse af en lineær regression med lav R 2 -værdi Denne gennemgang omhandler figur 13 i Regn med biologi. Man kan sagtens lave beregninger på egne data. Forsøgsmæssigt kræver det bare en tommestok tapet

Læs mere

Genetik og arvelighed - husdyr, Arbejdsark 1

Genetik og arvelighed - husdyr, Arbejdsark 1 Genetik og arvelighed - husdyr, Arbejdsark 1 Heste har 64 kromosomer. 32 fra sin mor og 32 fra sin far. Alle gener i hestens arvemateriale findes derfor i to varianter, som hver for sig kaldes alleller.

Læs mere

Skriftlig eksamen i samfundsfag

Skriftlig eksamen i samfundsfag OpenSamf Skriftlig eksamen i samfundsfag Indholdsfortegnelse 1. Introduktion 2. Præcise nedslag 3. Beregninger 3.1. Hvad kan absolutte tal være? 3.2. Procentvis ændring (vækst) 3.2.1 Tolkning af egne beregninger

Læs mere

Deskriptiv statistik. Version 2.1. Noterne er et supplement til Vejen til matematik AB1. Henrik S. Hansen, Sct. Knuds Gymnasium

Deskriptiv statistik. Version 2.1. Noterne er et supplement til Vejen til matematik AB1. Henrik S. Hansen, Sct. Knuds Gymnasium Deskriptiv (beskrivende) statistik er den disciplin, der trækker de væsentligste oplysninger ud af et ofte uoverskueligt materiale. Det sker f.eks. ved at konstruere forskellige deskriptorer, d.v.s. regnestørrelser,

Læs mere

Dig og din puls Lærervejleding

Dig og din puls Lærervejleding Dig og din puls Lærervejleding Indledning I det efterfølgende materiale beskrives et forløb til matematik C, hvori eleverne skal måle hvilepuls og arbejdspuls og beskrive observationerne matematisk. Materialet

Læs mere

Velkommen til Flemmings store Maplekursus 1. lektion. Skift mellem tekst- og matematikmode

Velkommen til Flemmings store Maplekursus 1. lektion. Skift mellem tekst- og matematikmode Velkommen til Flemmings store Maplekursus 1. lektion. Skift mellem tekst- og matematikmode Man kan skifte mellem tekst- og matemamatikmode ved at trykke på F5. I øjeblikket er jeg i tekstmode.. 2. lektion.

Læs mere

3. Trekantsberegninger. Gør rede for cosinusrelationen i vilkårlige trekanter.

3. Trekantsberegninger. Gør rede for cosinusrelationen i vilkårlige trekanter. Matematik B, 2x - sommereksamen 2014 NB! Prøvespørgsmålene kan ændres på foranledning af censor 1. Trekantsberegninger Gør rede for en trekants vinkelsum og areal. Gør endvidere rede for ensvinklede trekanter.

Læs mere

Maple 11 - Chi-i-anden test

Maple 11 - Chi-i-anden test Maple 11 - Chi-i-anden test Erik Vestergaard 2014 Indledning I dette dokument skal vi se hvordan Maple kan bruges til at løse opgaver indenfor χ 2 tests: χ 2 - Goodness of fit test samt χ 2 -uafhængighedstest.

Læs mere

for matematik pä B-niveau i hf

for matematik pä B-niveau i hf for matematik pä B-niveau i hf 014 Karsten Juul TEST 1 StikprÅver... 1 1.1 Hvad er populationen?... 1 1. Hvad er stikpråven?... 1 1.3 Systematiske fejl ved valg af stikpråven.... 1 1.4 TilfÇldige fejl

Læs mere

Værktøjshjælp for TI-Nspire CAS Struktur for appendiks:

Værktøjshjælp for TI-Nspire CAS Struktur for appendiks: Værktøjshjælp for TI-Nspire CAS Struktur for appendiks: Til hvert af de gennemgåede værktøjer findes der 5 afsnit. De enkelte afsnit kan læses uafhængigt af hinanden. Der forudsættes et elementært kendskab

Læs mere

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test] Anvendt Statistik Lektion 6 Kontingenstabeller χ 2- test [ki-i-anden-test] Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination af

Læs mere

Statistik i GeoGebra

Statistik i GeoGebra Statistik i GeoGebra Peter Harremoës 13. maj 2015 Jeg vil her beskrive hvordan man kan lave forskellige statistiske analyser ved hjælp af GeoGebra 4.2.60.0. De statistiske analyser svarer til pensum Matematik

Læs mere

Spørgeskemaundersøgelser og databehandling

Spørgeskemaundersøgelser og databehandling DASG. Nye veje i statistik og sandsynlighedsregning. side 1 af 12 Spørgeskemaundersøgelser og databehandling Disse noter er udarbejdet i forbindelse med et tværfagligt samarbejde mellem matematik og samfundsfag

Læs mere

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17 nalysestrategi Vælg statistisk model. Estimere parametre i model. fx. lineær regression Udføre modelkontrol beskriver modellen data tilstrækkelig godt og er modellens antagelser opfyldte fx. vha. residualanalyse

Læs mere

Matematik i biologi Faglig udvikling i praksis (FIP)

Matematik i biologi Faglig udvikling i praksis (FIP) Matematik i biologi Faglig udvikling i praksis (FIP) 2. Marts 2016 Gl. Hellerup Gymnasium Frank Grønlund Jørgensen Tørring Gymnasium Biologi er et kvantitativt fag På alle niveauer, også c-niveau Udvalgte

Læs mere

Kønsproportion og familiemønstre.

Kønsproportion og familiemønstre. Københavns Universitet Afdeling for Anvendt Matematik og Statistik Projektopgave forår 2005 Kønsproportion og familiemønstre. Matematik 2SS Inge Henningsen februar 2005 Indledning I denne opgave undersøges,

Læs mere

Eksempel på besvarelse af spørgeordet Hvad kan udledes (beregn) inkl. retteark.

Eksempel på besvarelse af spørgeordet Hvad kan udledes (beregn) inkl. retteark. Eksempel på besvarelse af spørgeordet Hvad kan udledes (beregn) inkl. retteark. Denne opgavetype kan tage sig ud på forskellig vis, da det udleverede materiale enten kan være en tabel eller en figur. Nedenfor

Læs mere

Statistik med TI-Nspire CAS version 3.2. Bjørn Felsager September 2012. [Fjerde udgave]

Statistik med TI-Nspire CAS version 3.2. Bjørn Felsager September 2012. [Fjerde udgave] Statistik med TI-Nspire CAS version 3.2 Bjørn Felsager September 2012 [Fjerde udgave] Indholdsfortegnelse Forord Beskrivende statistik 1 Grundlæggende TI-Nspire CAS-teknikker... 4 1.2 Lister og regneark...

Læs mere

Modul 3: Sandsynlighedsregning

Modul 3: Sandsynlighedsregning Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen Modul 3: Sandsynlighedsregning 3.1 Sandsynligheder................................... 1 3.2 Tilfældig udtrækning fra en mængde........................

Læs mere

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable Statistik II Lektion 3 Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable Setup: To binære variable X og Y. Statistisk model: Konsekvens: Logistisk regression: 2 binære var. e e X Y P

Læs mere

Test nr. 6 af centrale elementer 02402

Test nr. 6 af centrale elementer 02402 QuizComposer 2001- Olaf Kayser & Gunnar Mohr Contact: admin@quizcomposer.dk Main site: www.quizcomposer.dk Test nr. 6 af centrale elementer 02402 Denne quiz angår forståelse af centrale elementer i kursus

Læs mere

Dandy Walker Like Malformation

Dandy Walker Like Malformation Dandy Walker Like Malformation Speciale af Hedvig Christiansson and Evelina Kling Vegeby Præsenteret af Helle Friis Proschowsky Dyrlæge, Phd., Specialkonsulent hos DKK DWLM projektet 1. Hvad er DWLM 2.

Læs mere

MATEMATIK B til A Vejledende løsning på eksamensopgaven fra 27 maj 2016 STX

MATEMATIK B til A Vejledende løsning på eksamensopgaven fra 27 maj 2016 STX MATEMATIK B til A Vejledende løsning på eksamensopgaven fra 27 maj 2016 STX Anders Jørgensen & Mark Kddafi 2016 matematikhfsvar.page.tl 8. august 2016 15. august 2016 Anders Jørgensen & Mark Kddafi MATEMATIK

Læs mere

statistik statistik viden fra data statistik viden fra data Jens Ledet Jensen Aarhus Universitetsforlag Aarhus Universitetsforlag

statistik statistik viden fra data statistik viden fra data Jens Ledet Jensen Aarhus Universitetsforlag Aarhus Universitetsforlag Jens Ledet Jensen på data, og statistik er derfor et nødvendigt værktøj i disse sammenhænge. Gennem konkrete datasæt og problemstillinger giver Statistik viden fra data en grundig indføring i de basale

Læs mere

Dig og din puls. 17-10-2004 Dig og din puls Side 1 af 17

Dig og din puls. 17-10-2004 Dig og din puls Side 1 af 17 Dig og din puls Jette Rygaard Poulsen, Frederikshavn Gymnasium og HF-kursus Hans Vestergaard, Frederikshavn Gymnasium og HF-kursus Søren Lundbye-Christensen, AAU 17-10-2004 Dig og din puls Side 1 af 17

Læs mere

Hvor kommer du fra? Hvordan kan vi bruge data fra projektet i undervisningssammenhæng?

Hvor kommer du fra? Hvordan kan vi bruge data fra projektet i undervisningssammenhæng? Hvor kommer du fra Hvordan kan vi bruge data fra projektet i undervisningssammenhæng Slutkonference ulaen på arhus Universitet, d. 31 marts 2014 Frank Grønlund Jørgensen Ph.d. i biologi fra U med fokus

Læs mere

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test] Anvendt Statistik Lektion 6 Kontingenstabeller χ 2 -test [ki-i-anden-test] 1 Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination

Læs mere

Statistik viden eller tilfældighed

Statistik viden eller tilfældighed MATEMATIK i perspektiv Side 1 af 9 DNA-analyser 1 Sandsynligheden for at en uskyldig anklages Følgende histogram viser, hvordan fragmentlængden for et DNA-område varierer inden for befolkningen. Der indgår

Læs mere

Fig. 1 Billede af de 60 terninger på mit skrivebord

Fig. 1 Billede af de 60 terninger på mit skrivebord Simulation af χ 2 - fordeling John Andersen Introduktion En dag kastede jeg 60 terninger Fig. 1 Billede af de 60 terninger på mit skrivebord For at danne mig et billede af hyppighederne flyttede jeg rundt

Læs mere

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05 Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ

Læs mere

Neonatal screeningsalgoritme for cystisk fibrose

Neonatal screeningsalgoritme for cystisk fibrose Neonatal screeningsalgoritme for cystisk fibrose Forslag til dansk screeningsalgoritme for CF 1. First tier: Alle nyfødte får målt immunoreaktiv trypsinogen (IRT) i den etablerede filterpapirblodprøve,

Læs mere

Baggrundsnotat: Søskendes uddannelsesvalg og indkomst

Baggrundsnotat: Søskendes uddannelsesvalg og indkomst 17. december 2013 Baggrundsnotat: Søskendes uddannelsesvalg og indkomst Dette notat redegør for den økonometriske analyse af indkomstforskelle mellem personer med forskellige lange videregående uddannelser

Læs mere

Skriv punkternes koordinater i regnearket, og brug værktøjet To variabel regressionsanalyse.

Skriv punkternes koordinater i regnearket, og brug værktøjet To variabel regressionsanalyse. Opdateret 28. maj 2014. MD Ofte brugte kommandoer i Geogebra. Generelle Punktet navngives A Geogebra navngiver punktet Funktionen navngives f Funktionen navngives af Geogebra Punktet på grafen for f med

Læs mere

Løsning til eksamen d.27 Maj 2010

Løsning til eksamen d.27 Maj 2010 DTU informatic 02402 Introduktion til Statistik Løsning til eksamen d.27 Maj 2010 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th edition]. Opgave I.1

Læs mere

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ

Læs mere

Modelkontrol i Faktor Modeller

Modelkontrol i Faktor Modeller Modelkontrol i Faktor Modeller Julie Lyng Forman Københavns Universitet Afdeling for Anvendt Matematik og Statistik Statistik for Biokemikere 2003 For at konklusionerne på en ensidet, flersidet eller hierarkisk

Læs mere

Eksponentielle funktioner for C-niveau i hf

Eksponentielle funktioner for C-niveau i hf Eksponentielle funktioner for C-niveau i hf 2017 Karsten Juul Procent 1. Procenter på en ny måde... 1 2. Bestem procentvis ændring... 2 3. Bestem begyndelsesværdi... 2 4. Bestem slutværdi... 3 5. Vækstrate...

Læs mere

Kapitel 7 Forskelle mellem centraltendenser

Kapitel 7 Forskelle mellem centraltendenser Kapitel 7 Forskelle mellem centraltendenser Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 / 29 Indledning 1. z-test for ukorrelerede data 2. t-test for ukorrelerede data med ens

Læs mere

Eksempel på logistisk vækst med TI-Nspire CAS

Eksempel på logistisk vækst med TI-Nspire CAS Eksempel på logistisk vækst med TI-Nspire CAS Tabellen herunder viser udviklingen af USA's befolkning fra 1850-1910 hvor befolkningstallet er angivet i millioner: Vi har tidligere redegjort for at antallet

Læs mere

Statistik II 4. Lektion. Logistisk regression

Statistik II 4. Lektion. Logistisk regression Statistik II 4. Lektion Logistisk regression Logistisk regression: Motivation Generelt setup: Dikotom(binær) afhængig variabel Kontinuerte og kategoriske forklarende variable (som i lineær reg.) Eksempel:

Læs mere

Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression

Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression Statikstik II 2. Lektion Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression Sandsynlighedsregningsrepetition Antag at Svar kan være Ja og Nej. Sandsynligheden for at Svar Ja skrives

Læs mere

Konfidensintervaller og Hypotesetest

Konfidensintervaller og Hypotesetest Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele Repetition fra sidst: Konfidensintervaller

Læs mere

Avl på honningbier det genetiske grundlag I

Avl på honningbier det genetiske grundlag I Avl på honningbier det genetiske grundlag I Egenskaber ved alle levende væsner bestemmes af 2 ting: Arv Miljø Grundlaget for alt avlsarbejde er at mange egenskaber nedarves. Hvad er arv og hvad er miljø

Læs mere

Bilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen

Bilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen Bilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen Microsoft Excel har en del standard anvendelsesmuligheder i forhold til den beskrivende statistik og statistisk

Læs mere

Samfundsfagslærerens lille manual vol. II

Samfundsfagslærerens lille manual vol. II Samfundsfagslærerens lille manual vol. II Hvilke beregningsopgaver bør trænes i undervisningen? Formålet her er, at danne overblik over hvilke beregningsopgaver der hører ind under daglig samfundsfagsundervisningen

Læs mere

Mobning på arbejdspladsen. En undersøgelse af oplevelser med mobning blandt STEM-ansatte

Mobning på arbejdspladsen. En undersøgelse af oplevelser med mobning blandt STEM-ansatte Mobning på arbejdspladsen En undersøgelse af oplevelser med mobning blandt STEM-ansatte September 2018 Mobning på arbejdspladsen Resumé Inden for STEM (Science, Technology, Engineering & Math) var der

Læs mere

1 Hb SS Hb Sβ Hb SC = , (s = )

1 Hb SS Hb Sβ Hb SC = , (s = ) PhD-kursus i Basal Biostatistik, efterår 2006 Dag 6, onsdag den 11. oktober 2006 Eksempel 9.1: Hæmoglobin-niveau og seglcellesygdom Data: Hæmoglobin-niveau (g/dl) for 41 patienter med en af tre typer seglcellesygdom.

Læs mere

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0 Hypotesetest Hypotesetest generelt Ingredienserne i en hypotesetest: Statistisk model, f.eks. X 1,,X n uafhængige fra bestemt fordeling. Parameter med estimat. Nulhypotese, f.eks. at antager en bestemt

Læs mere

GL. MATEMATIK B-NIVEAU

GL. MATEMATIK B-NIVEAU GL. MATEMATIK B-NIVEAU Vejledende eksempler på eksamensopgaver og eksamensopgaver i matematik 29. maj 2013 2016 Opgave 1 Opgave 2 Opgave 3 Opgave 4 Vejledende eksempler på eksamensopgaver og eksamensopgaver

Læs mere

Projekt 2.9 Sumkurver som funktionsudtryk anvendt til Lorenzkurver og Ginikoefficienter (især for B- og A-niveau)

Projekt 2.9 Sumkurver som funktionsudtryk anvendt til Lorenzkurver og Ginikoefficienter (især for B- og A-niveau) Projekt 2.9 Sumkurver som funktionsudtryk anvendt til Lorenzkurver og Ginikoefficienter En sumkurve fremkommer ifølge definitionen, ved at vi forbinder en række punkter afsat i et koordinatsystem med rette

Læs mere

Maple. Skærmbilledet. Vi starter med at se lidt nærmere på opstartsbilledet i Maple. Værktøjslinje til indtastningsområdet. Menulinje.

Maple. Skærmbilledet. Vi starter med at se lidt nærmere på opstartsbilledet i Maple. Værktøjslinje til indtastningsområdet. Menulinje. Maple Dette kapitel giver en kort introduktion til hvordan Maple 12 kan benyttes til at løse mange af de opgaver, som man bliver mødt med i matematiktimerne på HHX. Skærmbilledet Vi starter med at se lidt

Læs mere

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test Statistik Lektion 0 Ikkeparametriske metoder Repetition KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,

Læs mere

Kvantitative metoder 2

Kvantitative metoder 2 Program for i dag: Kvantitative metoder Beskrivende statistik og analyse af kvalitatitive data 1. februar 007 Test i multinomialfordelingen: Q-testet (BL.13.1-) Opsamling fra sidste gang To eksempler To-dimensionale

Læs mere

Løsning eksamen d. 15. december 2008

Løsning eksamen d. 15. december 2008 Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

Sammenhængen mellem elevernes trivsel og elevernes nationale testresultater.

Sammenhængen mellem elevernes trivsel og elevernes nationale testresultater. Sammenhængen mellem elevernes trivsel og elevernes nationale testresultater. 1 Sammenfatning Der er en statistisk signifikant positiv sammenhæng mellem opnåelse af et godt testresultat og elevernes oplevede

Læs mere

Simulering af stokastiske fænomener med Excel

Simulering af stokastiske fænomener med Excel Simulering af stokastiske fænomener med Excel John Andersen, Læreruddannelsen i Aarhus, VIA Det kan være en ret krævende læreproces at udvikle fornemmelse for mange begreber fra sandsynlighedsregningen

Læs mere

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele Anvendt Statistik Lektion 4 Hypotesetest generelt Test for middelværdi Test for andele Hypoteser og Test Hypotese I statistik er en hypotese en påstand om en populationsparameter. Typisk en påstand om

Læs mere

Undervisningsbeskrivelse

Undervisningsbeskrivelse Undervisningsbeskrivelse Stamoplysninger til brug ved prøver til gymnasiale uddannelser Termin 2. juni 2014 Institution Kolding HF og VUC, Ålegården 2, 6000 Kolding (tovholder) VUC Vest, Stormgade 47,

Læs mere

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Uafhængighedstestet

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Uafhængighedstestet Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Uafhængighedstestet Eksempel: Bissau data Data kommer fra Guinea-Bissau i Vestafrika: 5273 børn blev undersøgt da de var yngre end 7 mdr og blev

Læs mere

SUPPLERENDE AKTIVITETER GYMNASIEAKTIVITETER

SUPPLERENDE AKTIVITETER GYMNASIEAKTIVITETER SUPPLERENDE AKTIVITETER GYMNASIEAKTIVITETER De supplerende aktiviteter er ikke nødvendige for at deltage i Masseeksperimentet, men kan bruges som et supplement til en undervisning, der knytter an til Masseeksperimentet

Læs mere

Kapitel 12 Variansanalyse

Kapitel 12 Variansanalyse Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 / 43 Indledning Sammenligning af middelværdien i to grupper indenfor en stikprøve kan

Læs mere

Normalfordelingen og Stikprøvefordelinger

Normalfordelingen og Stikprøvefordelinger Normalfordelingen og Stikprøvefordelinger Normalfordelingen Standard Normal Fordelingen Sandsynligheder for Normalfordelingen Transformation af Normalfordelte Stok.Var. Stikprøver og Stikprøvefordelinger

Læs mere

Gennemsnit og normalfordeling illustreret med terningkast, simulering og SLUMP()

Gennemsnit og normalfordeling illustreret med terningkast, simulering og SLUMP() Gennemsnit og normalfordeling illustreret med terningkast, simulering og SLUMP() John Andersen, Læreruddannelsen i Aarhus, VIA Et kast med 10 terninger gav følgende udfald Fig. 1 Result of rolling 10 dices

Læs mere

En intro til radiologisk statistik. Erik Morre Pedersen

En intro til radiologisk statistik. Erik Morre Pedersen En intro til radiologisk statistik Erik Morre Pedersen Hypoteser og testning Statistisk signifikans 2 x 2 tabellen og lidt om ROC Inter- og intraobserver statistik Styrkeberegning Konklusion Litteratur

Læs mere

Løsning til eksaminen d. 29. maj 2009

Løsning til eksaminen d. 29. maj 2009 DTU Informatik 02402 Introduktion til Statistik 20-2-01 LFF/lff Løsning til eksaminen d. 29. maj 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

UNDERVISNINGSEFFEKT-MODELLEN 2006 METODE OG RESULTATER

UNDERVISNINGSEFFEKT-MODELLEN 2006 METODE OG RESULTATER UNDERVISNINGSEFFEKT-MODELLEN 2006 METODE OG RESULTATER Undervisningseffekten udregnes som forskellen mellem den forventede og den faktiske karakter i 9. klasses afgangsprøve. Undervisningseffekten udregnes

Læs mere

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Anvendt Statistik Lektion 8. Multipel Lineær Regression Anvendt Statistik Lektion 8 Multipel Lineær Regression 1 Simpel Lineær Regression (SLR) y Sammenhængen mellem den afhængige variabel (y) og den forklarende variabel (x) beskrives vha. en SLR: ligger ikke

Læs mere