FORSØGSPROTOKOL. Nye associationer baseret på eksisterende GWAS-data

Relaterede dokumenter
Prædiktion af almindelige fænotyper baseret på SNP data fra hele genomet

for Komitésystemets behandling af sundhedsvidenskabelige forskningsprojekter med omfattende kortlægning af den menneskelige arvemasse

Epidemiology of Headache

Social ulighed i sundhed starter allerede i graviditeten

RE-EKSAMEN I EPIDEMIOLOGISKE METODER IT & Sundhed, 2. semester

Genetisk, epi-genetisk og metabolomic studie af svær overvægt hos børn baseret på. den Danske Fødselskohorte Bedre Sundhed for Mor og Barn

Association mellem maternal rygning og risiko for overvægt hos børn

REGIONERNES FÆLLES TJEKLISTE

Personlig medicin: Styr på teknologien og de kloge hoveder

1. Undersøgelsesmetoder, der hører under begrebet omfattende kortlægning

Biologiske signaler i graviditeten - Genetisk information

Registerforskningens brug af og behov for digitale arkiver

Vejledning om genomforsøg

Er udvikling af infektiøs mononukleose (kyssesyge) genetisk betinget?

KOM INDENFOR I DANMARKS NATIONALE BIOBANK

Ovl. Hans Mørch Jensen Prof. L. V. Kessing. Prof. Ø. Lidegaard Prof. P. K. Andersen PhD, MD, L. H. Pedersen Biostatistiker Randi Grøn

Vejledning til sundhedspersonale vedrørende mundtlig information til patienten i forbindelse med skriftligt samtykke ved omfattende genetisk analyse

Genetiske Aspekter af HCM hos Kat. - en introduktion til forskningsprojektet

Første trimester screening for svangerskabsforgiftning

Stress og søvn i projekt Sund start Nanna J. Olsen

Genetisk og epi-genetisk studie af børn fra ekstrem fede mødre baseret på. den danske fødselskohorte Bedre Sundhed for Mor og Barn

9. Dokumentation for den forsøgsansvarliges uddannelse (f.eks. autorisationsid).

Blodprøveanalyser og biobank fra navlesnorsblod hos nyfødte

REGIONERNES FÆLLES TJEKLISTE

Samarbejdsaftale mellem Dansk CancerBiobank centerafdeling og klinisk afdeling/forskergruppe BLOD

Sundheds- og Ældreudvalget L 146 Bilag 2 Offentligt

Genomisk medicin- nyt paradigme i sundhedsvæsenet. Nye etiske, juridiske og samfundsmæssige udfordringer i hel-genom-analyse-æraen

Biologiske Signaler i Graviditeten

Resultater fra et landsdækkende randomiseret kontrolleret rygeinterventions-trial: X:IT

Kost og Hjerte- Kar-Sygdom. Jette Heberg cand.scient.san og stud.phd /Hjerteforeningen

Når hele befolkningen er et kohorte studie

- men er det farligt for mennesker?

Biologiske signaler i graviditeten - Genetisk information

Vedtægter for styregruppen for den nationale fødselskohorte Bedre Sundhed for Mor og Barn.

Vejledning om forskning i menneskets arvemasse

Bedre diagnostik flere tilfældighedsfund Dilemmaer ved genom-undersøgelser i diagnostik

Logistisk regression

Hvorfor og hvordan inddrages søvn og stress i interventionen? Projekt Sund start

9. Chi-i-anden test, case-control data, logistisk regression.

Danish National Biobank (nationalbiobank.dk)

Undersøgelse af arvelige faktorer ved autisme

Danish Consortium for Neuromuscular Diseases. Genomsekventering klinisk anvendelse

Esben N. Flindt, platformskoordinator Danske Regioner Personlig Medicin 10. december Danske Regioner - Personlig Medicin 10/

Pædodontisk forskning og spidskompetence - giver det bedre oral helse for børn og unge? Sven Poulsen

Mæslinge-fåresyge-røde hunde-vaccine ved 6 måneders alderen, immunologi og morbiditet blandt danske småbørn

INSTITUTFORUM 24. APRIL 2017

Oliver Hendricks Overlæge, ph.-d. Klinisk lektor Syddansk Universitet

Vurdering af epidemiologiske undersøgelser. Epidemiologisk forskning

Belastende og beskyttende faktorer for selvmordsadfærd før udsendelse en nested casekontrol

DU KAN FÅ PDF-FIL AF ARTIKLERNE VED AT SKRIVE TIL REDAKTIONEN.

Børn og unge med livstruende og livsbegrænsende sygdomsdiagnoser

Lille mand stor biobank big data

Tandstatus hos søskende

Testsagen 2016 Kvalitetsudvikling af komitésystemet

Det bliver lettere at se forskel på syge og raske gener i Danmark

EPIDEMIOLOGI MODUL 7. April Søren Friis Institut for Epidemiologisk Kræftforskning Kræftens Bekæmpelse DAGENS PROGRAM

ERFARINGER FRA FORSØGSPROGRAMMET OM MODERSMÅLSBASERET UNDERVISNING UVM INFOMØDE

Hvordan får vi bugt med det fedmefremmende samfund?

Psykosocialt arbejdsmiljø og psykisk helbred

Sundhedsdataforskning Etiske udfordringer. Søren Holm University of Manchester & Universitetet i Oslo & Aalborg Universitet

Alfa-1-antitrysin mangel hos børn. Elisabeth Stenbøg, Afd.læge, PhD Børneafd. A, AUH

OBSERVERENDE UNDERSØGELSER. Kim Overvad Institut for Epidemiologi og Socialmedicin Aarhus Universitet Forår 2002

Summary The thesis consists of three subprojects:

Skanning af cervix uteri

Præcision og effektivitet (efficiency)?

Hereditary Haemorrhagic Telangiectasia (HHT) er mere end næseblødning Hvad ØNH personalet bør vide om HHT og hvorfor

Blødgøring, natrium og sundhedseffekter Notat til HOFOR

Exarticulerede primære tænder

Kursus i Epidemiologi og Biostatistik. Epidemiologiske mål. Studiedesign. Svend Juul

Kommentarer til spørgsmålene til artikel 1: Ethnic differences in mortality from sudden death syndrome in New Zealand, Mitchell et al., BMJ 1993.

Personlig medicin i genetisk rådgivning og udredning

Igangsætning af fødsler i Danmark

Hvordan kan registerdata supplere klinisk forskning for at sikre bedre patientbehandling.

Betydningen af uterus fibromer for fertilitet og fødselskomplikationer, et register baseret studie.

Forskerservice. Vilkår under Persondataforordningen v/ Ane Dahl Jørgensen 24. maj 2018

UDKAST. Bekendtgørelse om Nationalt Genom Centers indsamling af genetiske oplysninger

A G I N G R E S E A R C H C E N T E R

TILBUD TIL BØRN MED SVÆR OVERVÆGT OG DERES FAMILIER. Center for Børn og Unges Sundhed. Praksisdag i Københavns Kommune 2018

Projekt Sund Start Minikonferencen Projekt Sund start, Dragør, September 2010

Deltagerinformation INFORMATION TIL DELTAGERE

Anlægsbærerundersøgelse ved autosomal recessive sygdomme

Fordele ved og udfordringer for styrket dansk sundhedsdataforskning. Mads Melbye National Sundhedsdokumentation og Forskning Statens Serum Institut

Luftforurening og støj fra gadetrafik ved boligen og risiko for. lav fødselsvægt, abort, dødfødsel og spædbarnsdød, udvikling af

KOMITÉSYSTEMETS TJEKLISTE INDHOLD KLINISKE LÆGEMIDDELFORSØG

Brystkræftscreening og overdiagnostik hvordan forstår vi stigningen i incidens?

Neonatal screeningsalgoritme for cystisk fibrose

Transplacental-Acquired Antibodies and ADHD

Teknologispredning i sundhedsvæsenet DK ITEK: Sundhedsteknologi som grundlag for samarbejde og forretningsudvikling

DANSKE MÆNDS SÆDKVALITET - SER DET GODT ELLER SKIDT UD?

RUTINE HJERTESCANNING

Ensomhed og hjertesygdom

Deltagerinformation INFORMATION TIL DELTAGERE

Diabetes Impact Study

Alkoholforbrug og graviditet: Risici, holdninger og informationspraksis.

Motion under graviditeten forskning og resultater

1ste Nationale Jordemoderfaglige Forsknings- og udviklingsdag Rigshospitalet, København 3. okt 2008 Mette Juhl

Maternal request Sandbjerg 2007

Forskning i menneskets arvemasse videnskabsetiske overvejelser

københavns universitet det natur- og biovidenskabelige fakultet DELTAGERINFORMATION OM FORSKNINGSPROJEKTET SKOT III MØDRE

Fokuserede spørgsmål [NKR 31] Tonsillektomi Version 14, 15. december 2015 Indhold

Transkript:

FORSØGSPROTOKOL Nye associationer baseret på eksisterende GWAS-data Baggrund Gennem nationale sundheds- og befolkningsregistre samt en national biobank med millioner af biologiske prøver har vi i Danmark unikke muligheder for biomedicinsk forskning. Vores gruppe har benyttet disse ressourcer til genome-wide association studier (GWAS) af f.eks. pylorusstenose 1, 2, hypospadi 3, præterm fødsel 4-6 og feberkramper 7. GWAS er en hypotesefri metode og GWAS-data indeholder information om enkeltnukleotidpolymorfier (single nucleotide polymorphisms, SNPs) spredt over hele genomet. GWAS-data giver derfor mulighed for at finde nye associationer med andre fænotyper end dem som var det primære sigte for at generere data. Nogle sådanne sekundære fænotyper haves af mange forskellige forskningsgrupper over hele verden, og man kan derved foretage store meta-analyser. Vi har f.eks. deltaget i GWAS meta-analyser af børneeksem 8, fødselsvægt 9, 10, fødselslængde 11, kaffeforbrug 12, alder ved første menstruation 13, 14, BMI 15 og højde 16. Andre sekundære fænotyper egner sig mindre godt til internationale meta-analyser, idet kun få hvis nogen grupper uden for Danmark har information om disse fænotyper. Et eksempel kunne være frembrud af blivende tænder. Her har vi i et studie baseret på eksisterende GWAS data samt fænotyper fra sundhedsstyrelsens centrale odontologiske register (SCOR) kunnet identificere fire genregioner associeret med tidspunktet for hvornår børn får deres blivende tænder 17. SPECIFIKKE FORMÅL Det specifikke formål med dette projekt er at foretage associationsanalyser af eksisterende GWAS data for en række andre fænotyper, end dem der var det primære sigte da disse GWAS data blev genereret. Vi vil derpå søge at validere lovende fund ved genotypning af udvalgte associerede SNPs i uafhængige prøver. Projektet er en omkostningseffektiv metode til at få så mange biomedicinske opdagelser som muligt ud fra de store investeringer som blev brugt til at generere GWAS-dataene. Projektet (dvs. både de indledende analyser af GWAS data og genotypning af udvalgte SNPs) er afgrænset til følgende særligt lovende fænotyper (præciseret yderligere i metodeafsnittet): Fødselskarakteristika, som f.eks. placentavægt og hovedomfang ved fødslen tandsundhedsvariable, som f.eks. tandstilling og undertal af blivende tænder (hypodonti), immunologiske fænotyper: fjernelse af mandlerne (tonsillektomi) og forkølelsessår (herpes labialis) andre almindeligt forekommede fænotyper: navle- og lyskebrok (hernia), natlig sengevædning (enuresis) og svær graviditetskvalme (hyperemesis). Afd. for Epidemiologisk Forskning, Statens Serum Institut 1

Metode Vi søger om tilladelse til et registerstudie, hvor vi vil udføre genotypning af et mindre antal SNPs fordelt på forskellige almindelige fænotyper for at validere associationsresultater baseret på eksisterende GWAS-data. Eksisterende GWAS-data Flere end 17,000 individer er blevet genotypet med Illumina SNP arrays ved Statens Serum Institut fordelt på følgende projekter: Præterm fødsel (N=5,000, 660W-Quad chip) Fedme (N=4,000, 610-Quad chip) Feberkramper (N=2,000, OmniExpress Exome chip) Opioid afhængighed (N=1,400, OmniExpress chip) Atrieseptumdefekter (N=1,200, Omni1S chip) Pylorusstenose (N=1,200, 660W-Quad chip) Fødselsdepression (N=1,000, OmniExpress Exome chip) Hypospadi (N=1000, OmniExpress Exome chip) Hydrocephalus (N=800, OmniExpress Exome chip) Disse data er blevet oprenset og kvalitetskontrolleret efter anerkendte GWAS procedurer 18, 19. Ydermere har vi foretaget såkaldt imputation 20 for disse prøver ved hjælp af offentligt tilgængelige reference data fra 1000 Genomes Projektet 21. Vi er derved i stand til at analysere omkring 10 millioner almindelige genvarianter fordelt over hele genomet. Fænotypedata Vi vil analysere en række forskellige fænotyper, hvoraf de fleste vil blive indsamlet fra sundhedsregistre, så som medicinsk fødselsregister 22, landspatientregisteret 23 og sundhedsstyrelsens centrale odontologiske register, SCOR 24. Vores ansøgning er afgrænset til følgende fænotyper, som alle er delvist genetisk betingede og almindeligt forekommende eller kvantitative, hvorved vi har stor statistisk styrke til at opdage associationer med genetiske markører. 1) Fødselskarakteristika (følgende fænotyper fra Medicinsk Fødselsregister: fødselsvægt og - længde, placentavægt, hoved- og abdominalomfang, gestationsalder). Begrundelse: Fostres vækst og udvikling kan have betydning for senere forekomst af sygdomme 25, og det er derfor vigtigt at identificere sådanne faktorer med betydning for fødselskarakteristika. Der er belæg fra tidligere studier af os og andre for, at genetiske faktorer spiller en væsentlig rolle 9, 11, 26, 27. 2) Tandsundhed (følgende fænotyper fra Sundhedsstyrelsens Centrale Odontologiske Register: karies, gingivitis, parodontitis, frembrud af blivende tænder, forekomst af tandstillingsfejl). Begrundelse: Tvillingestudier har vist at genetiske faktorer har stor betydning for tandfrembrud, tandstilling og tandsundhed 28-31, men kun få genetiske varianter er indtil nu fundet 17, 32. Gennem brug af data fra Sundhedsstyrelsens Centrale Odontologiske Register er der unikke muligheder for bedre forståelse af genetiske faktorers betydning for tandsundhed og for at opdage specifikke genetiske mekanismer, som på sigt potentielt vil kunne bruges til bedre forebyggelse og behandling. 3) Fjernelse af mandlerne (følgende fænotyper fra Landspatientregisteret: tonsillektomi, akut tonsillitis, kroniske sygdomme i tonsiller og adenoide vegetationer). Begrundelse: Omkring 8-9% af danske børn og unge får fjernet mandlerne før de fylder 20 år 33, ofte på grund af hyppigt tilbagevendende halsbetændelser. Tonsillektomi er dermed en af de Afd. for Epidemiologisk Forskning, Statens Serum Institut 2

hyppigste operationer hos børn og unge, og det er vigtigt at forstå eventuelle underlæggende genetiske faktorer for potentielt at kunne forebygge nogle tonsillektomier. 4) Forkølelsessår (Følgende fænotype fra Bedre Sundhed for Mor og Barn undersøgelsen: forekomst af herpes labialis/forkølelsessår). Begrundelse: Stort set hele den voksne befolkning har været eksponeret for herpes simplex virus, men kun omkring en tredjedel oplever gentagne forkølelsessår. En væsentlig årsag til den variabilitet menes at skyldes genetiske faktorer, men kun lidt vides om konkrete genvarianters betydning 34. Identifikation af sådanne genvarianter vil give vigtig viden om det immunologiske respons på virusinfektion. 5) Navle- og lyskebrok (følgende fænotyper fra Landspatientregisteret: indgreb for hernia umbilicalis eller hernia inguinalis). Begrundelse: navle- og lyskebrok hos børn skyldes medfødte svagheder i bugvæggen og er en almindelig årsag til operation hos mindre børn 35. Familie- og tvillingestudier tyder på, at genetiske faktorer spiller en væsentlig rolle 36, 37, men der kendes ingen specifikke genvarianter. Potentielt kan en viden om sådanne varianter benyttes til at forudsige hvilke børn, der er særligt udsatte for at udvikle brok. 6) Natlig sengevædning (Følgende fænotype fra Bedre Sundhed for Mor og Barn undersøgelsen: Enuresis; spørgsmål fra BSMBs 11-års undersøgelse). Begrundelse: Natlig sengevædning ses hos omkring 10% af 7-årige børn og familie- og tvillingestudier viser en høj grad af arvelighed 38. Kendskabet til specifikke genetiske varianter og molekylære årsager er imidlertid meget begrænset. Gennem studiet kan denne viden udvides og fundne varianter kan danne udgangspunkt for videre studier af mulige behandlingsformer. 7) Graviditetskvalme (Følgende fænotype fra Bedre Sundhed for Mor og Barn undersøgelsen: hyperemesis gravidarum; spørgsmål om kvalme og opkastning fra interview 2). Begrundelse: kraftig kvalme og opkastninger ses i op til 2% af alle graviditeter 39 og udviser stærk familiær ophobning 40. Meget lidt vides om mulige specifikke genvarianter og molekylære årsager. Studiet vil være et vigtigt bidrag til at udvide denne viden. Generelt vil vi have tilstrækkelig statistisk styrke til at analysere udfald med en forekomst helt ned til nogle få procent (se nedenfor for styrkeberegninger). Projektet vil analysere de ovenfor beskrevne almindeligt forekommende fænotyper og foretage valideringsgenotypning i de tilfælde hvor GWAS-analyserne viser lovende resultater. Vi anslår, at op til 10-15 forskellige fænotyper vil vise stærke nok resultater i de eksisterende GWAS-data til at de udvælges til valideringsgenotypning i nye uafhængige prøver. Der skal i projektet ikke indhentes oplysninger fra forsøgspersonernes elektroniske patientjournal. Biologisk materiale Det biologiske materiale, der skal benyttes specifikt til dette projekt stammer den Neonatale Screenings Biobank (PKU-biobanken) samt BSMBs biobank, som begge er en del af Danmarks Nationale Biobank ved Statens Serum Institut. Det genetiske materiale DNA bliver oprenset og amplificeret fra 3mm store udstansede cirkler af filterpapir med fuldblod. Da mængden af biologisk materiale således er meget beskeden, vil der ikke være tale om spild eller om at overskydende materiale tilbageføres. For hver fænotype udvælges 400-800 prøver baseret på statistiske styrkeberegninger og for hver fænotype foretages genotypning af et mindre antal udvalgte SNPs med lovende resultater i GWAS-analyserne. Samlet anslår vi, at op til 8.000 uafhængige prøver vil blive genotypet for op til 50 SNPs hver. Genotypning Antallet af SNPs, som udvælges til valideringsgenotypning vil variere mellem de forskellige fænotyper afhængigt af hvor mange lovende fund, der ses i analyserne af de eksisterende GWAS-data. For nogle fænotyper vil det dreje sig om en håndfuld SNPs, mens det for andre fænotyper kan væ- Afd. for Epidemiologisk Forskning, Statens Serum Institut 3

re op til 50 SNPs. Genotypningen af SNPs foretages hos LGC Genomics (tidligere KBiosciences) i England ved hjælp af deres KASP teknologi. Dataanalyse Vores grundlæggende tilgang til den statistiske analyse af case-kontrol fænotyper vil være logistisk regression af fænotype mod SNP genotype under en additiv genetisk model. For kvantitative udfald (f.eks. placentavægt) benyttes lineær regression, også under en additiv model og eventuelt efter passende transformation af data. Yderligere eksplorative analyser vil undersøge specifikke genetiske modeller (dominant, recessiv, fuld genotype model). Vi vil også foretage analyser stratificeret for køn. Vi finder P værdier ved kvotientteststørrelser og alle tests er to-sidede. De statistiske analyser foretages ved hjælp af softwarepakkerne PLINK 41, R 42, SAS 43, SNPTEST 20, samt shell scripts og egne programmer. Vi har gennemført styrkeberegninger for GWAS-analyserne ved hjælp ved hjælp af genetic power calculator værktøjet 44, og vi viser nedenfor statistisk styrke for to forskellige allelfrekvenser og for forskellige prævalenser af fænotypen samt for forskellige effektstørrelser. Beregningerne viser at med en prøvestørrelse på 17,000 individer har vi god statistisk styrke til at kunne identificere genvarianter af moderat effektstørrelse ((odds ratios (ORs) mellem 1,4 og 2,0) for fænotyper med en prævalens ned til nogle få procent. Allelfrekvens 10%: Prævalens \ OR 1,4 1,7 2,0 1% 0% 3% 35% 3% 4% 82% >99% 5% 29% >99% >99% Allelfrekvens 30%: Prævalens \ OR 1,4 1,7 2,0 1% 1% 30% 86% 3% 44% >99% >99% 5% 93% >99% >99% De data, der genereres ved genotypningen skal analysere på Statens Serum Institut, Afd. for Epidemiologisk Forskning, hvor seniorforsker Bjarke Feenstra er forsøgsansvarlig. Afdelingen har allerede erfaring med at håndtere og analysere denne type data fra tilsvarende GWA-studier. Det kræver særligt IT udstyr, herunder særligt software til opbevaring og analyse af de store datamængder, som bliver genereret ved genotypningen. Alle disse ressourcer er allerede til stede i afdelingen. Risici, bivirkninger og ulemper Ingen enkeltpersoner vil skulle kontaktes i forbindelse med projektet, og der vil således ikke forekomme sundhedsrisici eller andre belastninger for de pågældende. Idet der i projektet analyseres eksisterende GWAS data samt genotypes udvalgte hyppige genvarianter (SNPs), er der ikke tale om omfattende kortlægning af genomet. Der vil således ikke forekomme tilfældighedsfund af sjældne mutationer i sygdomsgener, som kunne have betydning for forsøgsdeltagerne, da projektets data ikke indeholder information om sådanne sjældne mutationer. Alle data vil blive deidenti- Afd. for Epidemiologisk Forskning, Statens Serum Institut 4

ficeret (pseudonymiseret) inden de analyseres, og der vil ikke forekomme resultater på personniveau, ligesom analyseresultaterne ikke har nogen konsekvenser for den enkelte deltager. Pseudonymiseringen sker umiddelbart efter modtagelsen af data på en særlig dedikeret server. Dette foretages af Bjarke Feenstra, som ud over at være forsøgsansvalig også er databehandler. Herefter overføres de pseudonymiserede data til vores analyseserverere, hvor koblingen af genetiske og fænotypiske data sker på baggrund af de pseudonymiserede ID numre. Efter denne kobling foretages analyserne af data. De oprindelige personhenførbare data krypteres umiddelbart efter pseudonymiseringen med en nøgle, som kun forsøgsansvarlig kender. Det sikres, at der ikke inkluderes prøver fra personer, som står opført i Vævsanvendelsesregisteret. Økonomiske forhold Seniorforsker Bjarke Feenstra har taget initiativ til dette studie, som har til formål at identificere nye associationer baseret på eksisterende GWAS-data og validere fundene i uafhængige prøver. Danmarks Nationale Biobank modtager ingen økonomisk støtte i forbindelse med gennemførelsen af dette studie. Udgifter til laboratoriearbejde i forbindelse med dette specifikke studie planlægges finansieret gennem en opnået bevilling fra Novo Nordisk Fonden (1.200.000 kr.), som udbetales til SSI i årene 2015-2017. Midlerne til forskerløn haves fra arbejdssted. Der er ingen tilknytning mellem den forsøgsansvarlige og støttegiver(e). Der vil heller ikke forekomme vederlag til projektets deltagere, da der ikke er tale om at kontakte enkeltpersoner. Budget Videnskabsetisk godkendelse af studiet DNA ekstraktion og amplifikation Genotypning af 8.000 individer for 40 SNPs ved LGC genomics Løn til biostatistiker Rejseudgifter, præsentation af resultater ved konferencer Sum 5.000 DKK 240.000 DKK 330.000 DKK 600.000 DKK 25.000 DKK 1.200.000 DKK Etiske overvejelser Dette studie skal ses som et registerstudie. Det biologiske materiale, som skal benyttes, er allerede indhentet til den Neonatale Screeningsbank (PKU-biobanken) og til Bedre Sundhed for Mor og Barn biobanken. Prøver til PKU-biobanken tages rutinemæssigt af alle nyfødte i Danmark. Når en Afd. for Epidemiologisk Forskning, Statens Serum Institut 5

PKU-prøve tages, orienteres forældrene i en folder om, at overskydende materiale kan blive anvendt til fremtidig forskning. De deltagende mødre i BSMB har også givet tilladelse til at deres egne og deres børns prøver kan anvendes til forskningsprojekter og analyseres sammen med yderligere oplysninger fra journaler og registre. Afd. for Epidemiologisk Forskning har en generel tilladelse fra Datatilsynet (j. nr 2008-54-0472), som dækker dette studie. Styregrupperne for Bedre Sundhed for Mor og Barn undersøgelsen og den Neonatale Screeningsbank vil først tage stilling til en ansøgning, når det pågældende studie er godkendt af VEK. Fremfinding af prøver fra biobank foretages af SSIs egne laboranter, der er fortrolige med de rutiner og sikkerhedsforanstaltninger der gælder for SSI. Oprensning og amplificering af DNA fra filterpapir finder sted på Statens Serum Institut. Genotypningen af de enkelte SNPs finder sted hos LGC Genomics (tidligere KBiosciences) i England. Data skal så endelig analysere på Statens Serum Institut, Afd. for Epidemiologisk Forskning, hvor seniorforsker Bjarke Feenstra er forsøgsansvarlig. Afdelingen har alle påkrævede rutiner mht. datasikkerhed, og har den nødvendige ekspertise til behandling og analyse af disse store datamængder. Alle resultater, både positive, negative og inkonklusive, vil blive offentliggjort. Perspektiver Den data-drevne, hypotesefri GWAS tilgang til kortlægning af sygdomsgener har vist sig højst succesrig i løbet af de seneste 8 år. Tusinder af associationer er blevet fundet for hundreder af forskellige sygdomme og kvantitative træk (http://www.genome.gov/gwastudies/), hvilket har givet vigtige ledetråde til opfølgende undersøgelser af sygdomsmekanismer. I dette studie er formålet at benytte eksisterende GWAS-data og danske sundhedsregistre til at finde nye associationer for fænotyper, som ellers er vanskelige at studere. Studiet benytter en meget omkostningseffektiv fremgangsmåde, som potentielt kan give vigtig ny biomedicinsk viden, f.eks. om de bagvedliggende årsager til at nogle udvikler hyppigt tilbagevendende halsbetændelser, som gør at mandlerne må fjernes. Tidsplan Studiet forventes påbegyndt i januar 2015 og forventes afsluttet i december 2019. Reference List 1. Feenstra B, Geller F, Krogh C et al. Common variants near MBNL1 and NKX2-5 are associated with infantile hypertrophic pyloric stenosis. Nat Genet 2012;44(3):334-337. 2. Feenstra B, Geller F, Carstensen L et al. Plasma lipids, genetic variants near APOA1, and the risk of infantile hypertrophic pyloric stenosis. JAMA 2013;310(7):714-721. 3. Geller F, Feenstra B, Carstensen L et al. Genome-wide association analyses identify variants in developmental genes associated with hypospadias. Nat Genet 2014;46(9):957-963. Afd. for Epidemiologisk Forskning, Statens Serum Institut 6

4. Alleman BW, Myking S, Ryckman KK et al. No observed association for mitochondrial SNPs with preterm delivery and related outcomes. Pediatr Res 2012;72(5):539-544. 5. Myking S, Boyd HA, Myhre R et al. X-chromosomal maternal and fetal SNPs and the risk of spontaneous preterm delivery in a Danish/Norwegian genome-wide association study. PLoS One 2013;8(4):e61781. 6. Kim J, Stirling KJ, Cooper ME et al. Sequence variants in oxytocin pathway genes and preterm birth: a candidate gene association study. BMC Med Genet 2013;14:77. 7. Feenstra B, Pasternak B, Geller F et al. Common variants associated with general and MMR vaccine-related febrile seizures. Nat Genet 2014;46(12):1274-1282. 8. Paternoster L, Standl M, Chen CM et al. Meta-analysis of genome-wide association studies identifies three new risk loci for atopic dermatitis. Nat Genet 2012;44(2):187-192. 9. Horikoshi M, Yaghootkar H, Mook-Kanamori DO et al. New loci associated with birth weight identify genetic links between intrauterine growth and adult height and metabolism. Nat Genet 2013;45(1):76-82. 10. Tyrrell J, Huikari V, Christie JT et al. Genetic variation in the 15q25 nicotinic acetylcholine receptor gene cluster (CHRNA5-CHRNA3-CHRNB4) interacts with maternal self-reported smoking status during pregnancy to influence birth weight. Hum Mol Genet 2012;21(24):5344-5358. 11. van der Valk RJ, Kreiner-Moller E, Kooijman MN et al. A novel common variant in DCST2 is associated with length in early life and height in adulthood. Hum Mol Genet 2014. 12. Sulem P, Gudbjartsson DF, Geller F et al. Sequence variants at CYP1A1- CYP1A2 and AHR associate with coffee consumption. Hum Mol Genet 2011. 13. Elks CE, Perry JR, Sulem P et al. Thirty new loci for age at menarche identified by a meta-analysis of genome-wide association studies. Nat Genet 2010;42(12):1077-1085. 14. Perry JR, Day F, Elks CE et al. Parent-of-origin-specific allelic associations among 106 genomic loci for age at menarche. Nature 2014. 15. Locke AE, Kahali B, Berndt SI, Justice AE, Pers TH, Day FR. Genetic studies of body mass index yield new insights for obesity biology. Nature, accepted in principle 2014. 16. Wood AR, Esko T, Yang J, Vedantam S, Pers TH, Gustafsson S. Defining the role of common variation in the genomic and biological architecture of adult human height. Nature Genetics, in press 2014. 17. Geller F, Feenstra B, Zhang H et al. Genome-wide association study identifies four Loci associated with eruption of permanent teeth. PLoS Genet 2011;7(9):e1002275. Afd. for Epidemiologisk Forskning, Statens Serum Institut 6

18. Anderson CA, Pettersson FH, Clarke GM, Cardon LR, Morris AP, Zondervan KT. Data quality control in genetic case-control association studies. Nat Protoc 2010;5(9):1564-1573. 19. Laurie CC, Doheny KF, Mirel DB et al. Quality control and quality assurance in genotypic data for genome-wide association studies. Genet Epidemiol 2010;34(6):591-602. 20. Marchini J, Howie B. Genotype imputation for genome-wide association studies. Nat Rev Genet 2010;11(7):499-511. 21. Abecasis GR, Auton A, Brooks LD et al. An integrated map of genetic variation from 1,092 human genomes. Nature 2012;491(7422):56-65. 22. Knudsen LB, Olsen J. The Danish Medical Birth Registry. Dan Med Bull 1998;45(3):320-323. 23. Andersen TF, Madsen M, Jorgensen J, Mellemkjoer L, Olsen JH. The Danish National Hospital Register. A valuable source of data for modern health sciences. Dan Med Bull 1999;46(3):263-268. 24. Helm S. Recording system for the Danish Child Dental Health Services. Community Dent Oral Epidemiol 1973;1(1):3-8. 25. Barker DJ, Gluckman PD, Godfrey KM, Harding JE, Owens JA, Robinson JS. Fetal nutrition and cardiovascular disease in adult life. Lancet 1993;341(8850):938-941. 26. Freathy RM, Mook-Kanamori DO, Sovio U et al. Variants in ADCY5 and near CCNL1 are associated with fetal growth and birth weight. Nat Genet 2010;42(5):430-435. 27. Taal HR, St PB, Thiering E et al. Common variants at 12q15 and 12q24 are associated with infant head circumference. Nat Genet 2012;44(5):532-538. 28. Townsend G, Hughes T, Luciano M, Bockmann M, Brook A. Genetic and environmental influences on human dental variation: a critical evaluation of studies involving twins. Arch Oral Biol 2009;54 Suppl 1:S45-S51. 29. Townsend GC, Aldred MJ, Bartold PM. Genetic aspects of dental disorders. Aust Dent J 1998;43(4):269-286. 30. Boraas JC, Messer LB, Till MJ. A genetic contribution to dental caries, occlusion, and morphology as demonstrated by twins reared apart. J Dent Res 1988;67(9):1150-1155. 31. Wang X, Shaffer JR, Weyant RJ et al. Genes and their effects on dental caries may differ between primary and permanent dentitions. Caries Res 2010;44(3):277-284. 32. Fatemifar G, Hoggart CJ, Paternoster L et al. Genome-wide association study of primary tooth eruption identifies pleiotropic loci associated with height and craniofacial distances. Hum Mol Genet 2013;22(18):3807-3817. 33. Vestergaard H, Wohlfahrt J, Westergaard T, Pipper C, Rasmussen N, Melbye M. Incidence of tonsillectomy in Denmark, 1980 to 2001. Pediatr Infect Dis J 2007;26(12):1117-1121. Afd. for Epidemiologisk Forskning, Statens Serum Institut 7

34. Moraru M, Cisneros E, Gomez-Lozano N et al. Host genetic factors in susceptibility to herpes simplex type 1 virus infection: contribution of polymorphic genes at the interface of innate and adaptive immunity. J Immunol 2012;188(9):4412-4420. 35. Brandt ML. Pediatric hernias. Surg Clin North Am 2008;88(1):27-viii. 36. Jones ME, Swerdlow AJ, Griffith M, Goldacre MJ. Risk of congenital inguinal hernia in siblings: a record linkage study. Paediatr Perinat Epidemiol 1998;12(3):288-296. 37. Burcharth J, Pommergaard HC, Rosenberg J. The inheritance of groin hernia: a systematic review. Hernia 2013;17(2):183-189. 38. von GA, Schaumburg H, Hollmann E, Eiberg H, Rittig S. The genetics of enuresis: a review. J Urol 2001;166(6):2438-2443. 39. Eliakim R, Abulafia O, Sherer DM. Hyperemesis gravidarum: a current review. Am J Perinatol 2000;17(4):207-218. 40. Zhang Y, Cantor RM, MacGibbon K et al. Familial aggregation of hyperemesis gravidarum. Am J Obstet Gynecol 2011;204(3):230-237. 41. Purcell S, Neale B, Todd-Brown K et al. PLINK: a tool set for whole-genome association and population-based linkage analyses. Am J Hum Genet 2007;81(3):559-575. 42. R: A language and environment for statistical computing. 2013. 43. SAS 9.1. 2008. 44. Purcell S, Cherny SS, Sham PC. Genetic Power Calculator: design of linkage and association genetic mapping studies of complex traits. Bioinformatics 2003;19(1):149-150. Afd. for Epidemiologisk Forskning, Statens Serum Institut 8