Indhold. Indhold 5. Cellecyklus, mitose og meiose 55

Størrelse: px
Starte visningen fra side:

Download "Indhold. Indhold 5. Cellecyklus, mitose og meiose 55"

Transkript

1 Indhold Indhold 5 Forord 10 stamtræssymboler 12 Menneskets genom 15 Indledning 15 Det personlige genom og artens genom 15 Generelt om arvemateriale 17 DNA-replikation 18 Arvematerialets funktion 20 Proteinkodende gener 21 Transkription og posttranskriptionel modificering 28 Den genetiske kode 33 Translation og posttranslationelle modifikationer 33 Ikkekodende RNA 36 DNA ets organisering i cellekernen kromatin og kromosomer 43 Mitokondrie-DNA (mtdna) 47 Betydning og perspektiver 51 ellecyklus, mitose og meiose 55 Indledning 55 ellecyklus 55 Mitosen 57 Meiosen 58 Meiosens faser i relation til gametogenesen 60 Mitokondriernes forhold ved celledelinger 61 Genetisk variation 65 Indledning 65 Mutationers opståen 65 Mutationstyper 66 Genetiske markører og markøranalyser 77 Normal variant eller patogen mutation? 78 Beskrivelse af sekvensvariation på DNAog proteinniveau 79 ytogenetik og kromosomsygdomme 83 Indledning: Den cytogenetiske analyse 83 Den normale kromosomsammensætning 83 Kromosomafvigelser book.indb 5 09/12/

2 INDHOLD Mikrodeletionssyndromer og molekylær cytogenetik 100 Referencer 103 Arvegange, monogene sygdomme og mitokondriesygdomme 105 Dominans og recessivitet 108 Afvigelser fra klassiske nedarvningsmønstre 116 X-bundet recessiv sygdom 119 Mitokondriesygdomme 121 Patogen mutation eller normal variant? 124 Genetisk epidemiologi 127 Hvad er genetisk epidemiologi? 127 Genetisk-epidemiologiske metoder 127 Populationsgenetik 141 Multifaktoriel arv 147 Kvantitativ arv 147 Tærskelmodellen 148 Folkesygdomme 150 Psykiatriske sygdomme 152 Bipolær affektiv sindslidelse 154 Atopiske sygdomme 156 Inflammatoriske tarmsygdomme 157 Genetisk rådgivning 163 Hvad er genetisk rådgivning? 163 Genetisk rådgivning i specielle situationer 167 Specielle aspekter ved genetisk rådgivning 168 Prænatal genetisk diagnostik 173 Formålet 174 Organisationen af den prænatale genetiske diagnostik 174 Metoder til udtagning af føtalt væv 175 Diagnostisk ultralydscanning af fosteret 177 Sygdomme og misdannelser der kan påvises ved prænatal genetisk diagnostik 178 Prænatal screening for Downs syndrom (risikovurdering) 182 Indikationer for prænatal genetisk diagnostik 186 Rådgivning ved prænatal genetisk diagnostik 189 Resultater af prænatal genetisk diagnostik 190 Præimplantationsdiagnostik 191 Prænatal genetisk diagnostik i fremtiden 192 Supplerende litteratur 193 Postnatal genetisk screening 195 Indledning 195 Teoretiske overvejelser 195 Overordnede etiske overvejelser 196 Typer af postnatal screening 197 Afslutning book.indb 6 09/12/

3 INDHOLD Arvelige stofskiftesygdomme 201 Genetisk og biokemisk patologi 202 Abnorm kompartmentalisering pga. defekt membrantransport 207 Øget enzymaktivitet 208 Debutalder 210 Sygdomsmønstre 210 Sygdomsforløb 210 Dysmorfe træk 211 Screening 211 Specifikke biokemiske/ molekylærgenetiske analyser 214 Prænatal diagnostik 214 Neonatalscreening 214 Diæt 215 Enzymhæmning 215 Medikamentel reduktion af substrat 216 Medikamentel eliminering af biprodukter 216 Vitaminer 216 Substitution 216 Medikamentel bedring af enzymfunktion 217 Transplantation 217 Forebyggende foranstaltninger 218 Dysmorfologi 219 Isolerede misdannelser 223 Malformationssyndromer 224 Opslagsværker 230 ancergenetik arvelig disposition for cancer 231 Indledning 231 Arvelig cancerrisiko 232 ancer opstår ved en flertrinsproces 233 Onkogener 233 Tumorsuppressorgener (gatekeepers) 235 aretakers 236 ancer kan betragtes som en stamcelledefekt 237 Arvelighed ved de hyppigste former for cancer 237 Monogen/syndromal arvelig disposition for cancer 241 Risikoklassifikation: 242 Onkogenetisk udredning og rådgivning 248 Den onkogenetiske konsultation 251 Litteratur 253 ancercytogenetik 255 Indledning 255 De kromosomale sygdomsmekanismer ved cancer 258 Hvordan opstår gentagne specifikke kromosomforandringer? 259 ancerstamcellen og dens betydning for tumorudvikling 263 På hvilket tidspunkt i livet opstår kromosomforandringer? 263 Er de erhvervede kromosomforandringer tilstrækkelige til neoplastisk udvikling? book.indb 7 09/12/

4 INDHOLD Hvilke cytogenetiske metoder er bedst til at påvise neoplasi-relaterede forandringer? 264 De maligne hæmatologiske sygdomme 265 Normal hæmopoiese 265 Er abnorm hæmopoiese tilstrækkeligt til at medføre leukæmi/lymfom? 267 Korrelation mellem morfologi, fænotype og kromosomale rearrangementer. 269 Myeloproliferative neoplasier 270 Kronisk myeloid leukæmi (ML) 270 Myeloide og lymfoide neoplasier med eosinofili og aberrationer i PDGFRA, PDGFRB eller FGFR1 272 Myelodysplastiske syndromer/ Myeloproliferative sygdomme (MDS/ MPD) 272 Myelodysplastiske syndromer (MDS) 273 Akut myeloid leukæmi (AML) og relaterede precursor-neoplasier 273 Akut lymfatisk leukæmi (precursor lymfoide neoplasier) 275 B-celle-lymfoblastleukæmi (B-ALL)/ lymfom (B-LBL), uspecificeret 275 B-celle-lymfoblastleukæmi (B-ALL)/ lymfom (B-LBL) med gentagne genetiske forandringer 275 T-celle-lymfoblastær leukæmi (T-ALL)/ lymfoblastisk lymfom (T-LBL) 276 Modne B-celle-neoplasier 276 Kronisk lymfatisk leukæmi (LL)/Small lymphocytic lymphoma 276 Plasmacelle-neoplasier (myelomatose) 277 Follikulært lymfom, diffust storcellet B-lymfom, mantle-celle lymfom, Burkitts lymfom og MALTlymfom 278 Modne T-celle- og NK-celleneoplasier 278 Aggressiv NK-celle-leukæmi 278 Anaplastisk storcellet lymfom (ALL), ALK-positiv vs. ALK-negativ 278 Hodgkin-lymfom 278 Solide tumorer 279 Fremtidige perspektiver for cancercytogenetikken 280 Neurologiske og neuro muskulære sygdomme 285 Indledning 285 Misdannelser 286 Kromosomsygdomme 286 Mitokondriesygdomme 286 Sygdomme med monogen arvegang 286 Repeatsygdomme 287 Parkinsonisme 302 Mental retardering 307 Indledning 307 Intelligenskvotient 308 Genetiske årsager til mental retardering 309 Generelt om udredning og gentagelsesrisiko ved mental retardering 314 Litteratur book.indb 8 09/12/

5 INDHOLD Genterapi 317 Introduktion 317 Generelle principper 317 Risici 323 Fremtidige udviklinger og perspektiver 323 Litteratur 325 Molekylærgenetisk diagnostik metoder og teknikker 327 Indledning 327 Fragmentanalyse 332 Heteroduplex 333 SNP-analyse 334 Dynamiske mutationer 337 MLPA 340 MLPA methyleringsstatus 342 Array-teknologier 344 Array-GH 345 SNP-array 346 Ekspressions-array 347 Nye sekventeringsteknologier 349 Øjebliksbillede af NGS (Next Generation Sequencing) 349 Forfatteroversigt 359 Ordliste 363 Stikordsregister book.indb 9 09/12/

6 Forord Når man taler om menneskets arvelighedsforhold i et lægeligt perspektiv, skelner man gerne mellem tre genetiske discipliner: humangenetik, medicinsk genetik og klinisk genetik. Humangenetik er læren om menneskets arvemasse og variationen heri. Medicinsk genetik er læren om arvelige faktorers betydning for opståelsen af sygdomme hos mennesket, og endelig kan man definere klinisk genetik som den disciplin der omhandler den praktiske udmøntning af den medicinsk genetiske viden i diagnostik og genetisk rådgivning. Denne lægelige udfordring kræver dels kendskab til de kliniske manifestationer af genetiske sygdomme, dels udvikling og anvendelse af laboratoriediagnostiske analyser. Det er formålet med nærværende lærebog er at give en indføring på dansk i nogle af de vigtigste anvendelsesområder inden for medicinsk og klinisk genetik, og ved udarbejdelsen af bogen har fokus været på klinisk relevans, samtidig med at det biologiske og teoretiske fundament forklares. Den primære målgruppe for denne bog er medicinstuderende på 1. og 2. del, men det er vores håb at bogen også vil finde anvendelse i det postgraduate forløb, herunder i speciallægeuddannelserne. Humangenetikken er en forholdsvis ung videnskabelig disciplin der, ligesom anden genetik, har sit grundlag i de arvelighedslove den østrig-ungarnske munk og naturforsker Gregor Mendel opstillede i midten af 1860 erne. Uden at kende til det fysiske grundlag for arvematerialet beskrev han nedarvningsmønstrene for dominante og recessive egenskaber hos ærteplanter, og sluttede at de skyldes distinkte arvelige enheder, Elemente; det vi kalder arveanlæg eller gener. Mendels arbejder forblev dog i mange år stort set upåagtede, men omkring år 1900 blev de genopdaget, samtidig med at man nu fik fastere grund under fødderne med hensyn til arveanlæggenes lokalisation i cellen. Siden opdagelsen i 1953 af arvemassens molekylære struktur (DNA-molekylets dobbeltspiral, den såkaldte Watson-rick model) har udviklingen i vor viden om menneskets arvemasse været i en konstant ekspansiv fase. Denne udvikling nåede et foreløbigt klimaks i oktober 2004 med offentliggørelsen af den fuldstændige kemiske opbygning af menneskets arvemasse, i form af basesekvensen i menneskets DNA. Den medicinske genetik anses i dag for en kernedisciplin inden for biologi og lægevidenskab. Den har muliggjort en fundamental ny indsigt i årsag og patogenese ved arveligt betingede sygdomsprocesser, og fagets potentiale giver grundlag for meget store forventninger til den nære fremtid. Hvis patienterne og deres familier til fulde skal høste fordelene af vores voldsomt forøgede genetiske viden er det helt nødvendigt, at læger tilegner sig en forståelse af genetikkens grundbegreber og den rolle som genetiske faktorer spiller for individets udvikling samt for opståelsen af sygdom. Genetik som videnskab er baseret på en kraftfuld teori med stor forklaringsstyrke. Nøglebegrebet er enheden et gen, navngivet af den danske plantefysiolog og genetiker Wilhelm Johannsen i Genet er enheden for oplagring, videreførelse samt omsætning af den information, der er lagret i arvemassen, omend gen-be book.indb 10 09/12/

7 FORORD grebet har undergået en nødvendig udvikling i takt med kortlægningen af arvemassens struktur og funktion. Andre genetisk vigtige grundbegreber, ligeledes indført i den internationale terminologi af Wilhelm Johannsen, er genotype (anlægspræg) og fænotype (fremtoningspræg). I mange år udgjordes kerneområdet for den medicinske genetik af et raritetskabinet af monogene sygdomme som fx dværgvækst, blødersygdom og seglcelleanæmi; tilsammen nok et stort antal sygdomme, men hver for sig ganske sjældne. Det er siden blevet klart, dels at flertallet af de almindeligt forekommende sygdomme som åreforkalkning, sukkersyge, cancer og skizofreni har meget væsentlige genetiske årsagskomponenter, dels at de genetiske sammenhænge i disse tilfælde kun sjældent er så simple som for de klassiske arvelige sygdomme. I mange tilfælde spiller genetiske faktorer en afgørende rolle for tilbøjeligheden til at udvikle en given sygdom; i andre tilfælde er genetiske faktorer væsentlige elementer i organismens forsvar mod at udvikle sygdom. Den medicinske genetik har traditionelt været tættest associeret med pædiatri, men som en følge af fagets udvikling er den i dag relevant for alle lægevidenskabelige specialer, herunder ikke mindst neurologi, hæmatologi, kardiologi, psykiatri og onkologi; hertil kommer obstetrikken som den kliniske genetik har et nært samarbejde med om fosterdiagnostikken. Den videnskabelige udvikling inden for humangenetik og medicinsk genetik har på en bemærkelsesværdig hurtig måde givet afkast til den kliniske genetik. Således førte opdagelsen af enzymdefekten ved Føllings sygdom (fenylketonuri) i 1950 erne umiddelbart til den første succesrige behandling af en arvelig sygdom. Opdagelsen af menneskets kromosomtal i 1956 førte til diagnosen af den første kromosomsygdom i 1959 (trisomi 21 ved Downs syndrom). Et nyt gennembrud kom da prænatal diagnostik af kromosomsygdomme og visse arvelige stofskiftesygdomme blev mulig i slutningen af 1960 erne. Med udviklingen af rekombinant DNA-teknologi og DNA-diagnostik i 1970 erne og 1980 erne kunne genetisk rådgivning nu i mange tilfælde baseres på sikre diagnoser og ikke blot på udsagn om sandsynligheder og risiko. De seneste år har vi været vidne til den spæde begyndelse af genterapi og måske af større praktisk betydning udviklingen af nye lægemidler baseret på viden om sygdomsgener. De nye muligheder for anvendelsen af forskningsresultaterne fra genetikken kan i befolkningen udløse såvel skrækscenarier som urealistiske forventninger. Derfor er det vigtigt at der til stadighed føres en bred debat om den nye genetiks muligheder og de etiske aspekter heraf. Misbrug er altid en mulighed, men et demokrati med åben dialog er den bedste garant herimod. Der er et stort behov for information og uddannelse, både af lægmand og professionelle. Vi håber at denne bog vil kunne bidrage hertil. De senere års nærmest eksplosive udvikling inden for den humane og medicinske genetik nødvendiggør en hyppig opdatering af lærebøger i faget. Den foreliggende 2. udgave af Medicinsk Genetik er både ajourført og udvidet i forhold til første udgave. Bl.a. er der i 2. udgave tilføjet et egentligt metodekapitel samt en omfattende ordliste, og samtlige kapitler er revideret og opdateret i overensstemmelse med den udvikling faget har gennemløbet siden første udgave kom i Bogen er tilstræbt at være pensumdækkende for undervisningen i genetik på det medicinske studium i Danmark. Oktober 2011 Søren Nørby og Peter K.A. Jensen book.indb 11 09/12/

8 Stamtræssymboler book.indb 12 09/12/

9 STAMTRÆSSYMBOLER book.indb 13 09/12/

10 25139-book.indb 14 09/12/

11 Kapitel 1 Menneskets genom Indledning Levende organismer består af celler. Som en helt central del af deres biologi har organismerne på Jorden gennem årmillioners evolution udviklet et molekylært lager af information der styrer de overordnede processer i cellerne. Den enkelte organismes liv afhænger af at cellerne kan opbevare og afkode denne information samt videreføre den når cellerne deler sig. For artens eksistens er det endvidere nødvendigt at informationen videreføres fra generation til generation. Det er det biologisk arv drejer sig om, og denne information betegnes genetisk information. De molekyler der bærer den genetiske information, betegnes det genetiske materiale eller arvematerialet, og det samlede molekylære lager af genetisk information betegnes cellens/organismens arvemasse eller genom. Efter en generel introduktion om genomet vil dette kapitel gennemgå dels dets molekylære struktur og funktion, dels dets organisering i cellerne. Det personlige genom og artens genom Når man ser bort fra énæggede tvillinger (og andre flerlinger udviklet fra samme befrugtede æg), har vi hver vores eget personlige genom. Det er sammensat af det arvemateriale vi har fået fra vores biologiske forældre gennem de to kønsceller hvis fusionsprodukt vi er udviklet fra (Kap. 2). Arvematerialet består af nukleinsyren DNA (Boks 1.1. og 1.2). I cellerne er arvemassens DNA fordelt på dels cellekernen (det nukleære genom, kernegenomet), dels mitokondrierne (det mitokondrielle genom, mitokondriegenomet, s. 47ff.), Fig En persons nukleære genom udgøres af kromosomernes DNA-molekyler og er derfor diploidt (s. 55). Dertil kommer mitokondriegenomet (mitokondrie-dna, mtdna) som i en celle foreligger i et meget varierende antal kopier, idet både antallet af mitokondrier, og antallet af mitokondrie-dna-molekyler per mitokondrie, varierer fra celle til celle. Boks 1.1 Opdagelsen af DNA I slutningen af 1860 erne lagde schweizeren Johann Friedrich Miescher ( ) grunden til udforskningen af nukleinsyrer med sin opdagelse af det der skulle vise sig at være DNA. Han studerede hvide blodlegemer under et studieophold i den tyske universitetsby Tübingen. Udgangsmaterialet var pusfyldte bandager fra universitetshospitalets kirurgiske afdeling. Herfra isolerede han cellekerner og ekstraherede en hidtil ubeskrevet højmolekylær og fosforrig sur komponent som han navngav Nuklein (lat. nucleus, kerne). Senere foretog han, i hjembyen Basel, yderligere ekstraktioner af det samme stof, denne gang fra laksesæd. Mieschers elev Richard Altmann ( ) forbedrede ekstraktionsmetoden og indførte betegnelsen Nukleinsäure (nukleinsyre) for den oprensede komponent. Omkring år 1900 havde man afklaret at nukleinsyre består af tre forskellige stofgrupper: fosfat, kulhydrat og nitrogenholdige baser. Se mere om opdagelsen af DNA på book.indb 15 09/12/

12 KAPITEL 1 MENNESKETS GENOM Menneskecelle ellekernen (det nukleære genom) Mitokondrie (mitokondriegenomet) Figur 1.1. Elementær skitse af et tværsnit af en celle til illustration af lokaliseringen af dens arvemasse (genom). Genomet består af to distinkte dele: 1) det nukleære genom, lokaliseret i cellekernens kromosomer, og 2) mitokondriegenomet, lokaliseret i mitokondrierne. Når man taler om menneskets genom, mener man nutidsmenneskets, arten Homo sapiens genom. I modsætning til et individ har en art ikke noget entydigt genom, men menneskets genom kan defineres som det minimumssæt af DNA-molekyler der repræsenterer en normal arvemasse hos mennesket. Det vil for det nukleære genoms vedkommende sige 24 DNAmolekyler som repræsenterer dem der er indeholdt i menneskets 24 forskellige kromosomer: kønskromosomerne X og Y samt de 22 autosomer (kromosomerne 1-22 inkl.) (Fig. 1.2 og Kap. 4, s. 83). Dette betegnes det haploide genom (haploid = med ét kromosomsæt, s. 55). En detaljeret kortlægning af det haploide humane genom, i form af fastlæggelsen af basesekvenserne for de 24 kromosomale DNA-molekyler, blev iværksat i 1990 med det store internationale Human Genome Project (HGP) og formelt erklæret for afsluttet i april 2003, præcis 50 år efter gennembruddet med afklaringen af DNA s dobbelthelix-struktur (Boks 1.4). Der resterer endnu (2011) 6-7 % af det i alt ca. 3,1 mia. basepar lange genom, som det ikke er lykkedes at sekventere færdigt. Dette skyldes tekniske vanskeligheder, idet de pågældende DNAsegmenter hovedsageligt består af højt repeteret DNA, dvs. mange kopier af gentagne sekvenser. Figur 1.2. Kromosombesætningen hos en kvinde med normal karyotype (46,XX); se også Figur 4.1 og Boks 4.2. Præparatet er båndfarvet (Giemsa-farvning), med kromosomspecifikke lyse og mørke bånd langs de enkelte kromosomer, hvilket muliggør den parvise anordning af kromosomerne. Tallene angiver de enkelte autosomale kromosompar 1-22, bogstaverne X og Y angiver pladserne for kønskromosomerne book.indb 16 09/12/

13 GENERELT OM ARVEMATERIALE Det drejer sig for størstedelens vedkommende om DNA i såkaldt konstitutivt heterokromatin (Boks 1.8) der ikke indeholder aktive gener. I den del af genomet der indeholder sekvenser af aktive gener, dvs. DNA i de eukromatinholdige dele af kromosomerne, har man kortlagt over 99 % af DNA-sekvensen, i alt 2,85 mia. bp (2,85 Gb), se Tabel 1.1 (for længdeangivelse af nukleinsyremolekyler, se Boks 1.5). For mitokondriegenomet har man siden 1981 haft en referencesekvens. Den først offentliggjorte sekvens viste sig dog at have en del fejl som blev endegyldigt rettet i 1999 (Boks 1.10). Denne mtdna-sekvens stammer fra ét enkelt individ. Man har ved denne detaljerede kortlægning fået indsigt i menneskets helt grundlæggende biologi. Samtidig har man fået en meget værdifuld referencesekvens for menneskets DNA til brug for det daglige DNA-diagnostiske arbejde i de klinisk genetiske afdelingers molekylærgenetiske laboratorier. Generelt om arvemateriale Arvemateriale består af molekyler tilhørende stofgruppen kernesyrer (nukleinsyrer). Det er kædemolekyler (polymerer) opbygget af enheder betegnet nukleotider. Der skelnes mellem to slags nukleinsyre: deoxyribonukleinsyre, også kaldet DNA (eng. tidligere Deoxyribose Nucleic Acid, nu deoxyribonucleic acid), og ribonukleinsyre, også kaldet RNA (eng. tidligere Ribose Nucleic Acid, nu ribonucleic acid). Alle cellulære organismer fra de simpleste bakterier til de mest komplekse planter og dyr, herunder mennesket har nukleinsyren DNA som arvemateriale. Blandt virus, som er biologiske strukturer med arvemateriale, men ikke selvstændigt levende organismer, har mange arter ligeledes DNA som arvemateriale (DNA-virus), andre har RNA (RNA-virus). Boks 1.2 Det første bevis for DNA som arvemateriale I 1944 offentliggjorde den amerikanske mikrobiolog Oswald T. Avery ( ) og medarbejdere forsøgsresultater som viste at en stamme af harmløse bakterier kunne ændres blivende til sygdomsfremkaldende ved at optage DNA fra en sygdomsfremkaldende stamme. Denne skelsættende påvisning af DNA som bærer af genetisk information var dog ikke tilstrækkelig til i sig selv at overbevise det videnskabelige samfund om at arvemateriale generelt består af DNA (se Boks 1.4). Den grundlæggende kemiske forskel mellem DNA og RNA ligger i molekylernes kulhydrat som i DNA er deoxyribose, i RNA ribose (Fig. 1.3, Boks 1.3), heraf nukleinsyrernes navne. I begge nukleinsyrer indgår der fire forskellige nukleotider, hver med deres nitrogenholdige base. Purinbaserne adenin og guanin samt pyrimidinbasen cytosin er fælles for DNA og RNA. I RNA indgår desuden nukleotider med pyrimidinbasen uracil, mens DNA som fjerde base har pyrimidinen thymin (5-methyluracil). Boks 1.3 DNA og RNA I begyndelsen af det 20. århundrede var kalvebrisler (thymus) og gær hovedkilderne til udvinding af nukleinsyre mhp. nærmere kemisk karakterisering. Kulhydratet i den gærnukleinsyre man havde isoleret, blev hurtigt identificeret som ribose, mens det tog årtier at få fastlagt at det i nukleinsyren fra thymus var deoxyribose. Konklusionen blev at de to nukleinsyrer var forskellige, hhv. hvad vi i dag betegner RNA og DNA, og på den baggrund troede man i lang tid at DNA var dyrerigets og RNA planterigets nukleinsyre. Det var først i 1930 erne at det blev endeligt klarlagt at både plante- og dyreceller indeholder såvel DNA som RNA book.indb 17 09/12/

14 KAPITEL 1 MENNESKETS GENOM A B HOH 2 O OH H H H H OH OH Ribose H H O N NH H Uracil O HOH 2 O OH H H H H OH H Deoxyribose H 3 H O N NH H Thymin O 5' 3' Figur 1.3. Strukturelle forskelle mellem DNA og RNA. A. RNA indeholder kulhydratet ribose, mens DNA indeholder 2 -deoxyribose. B. RNA indeholder basen uracil, DNA basen thymin (5-methyluracil).. RNA-molekyler er polynukleotider ligesom DNA-molekyler, med nukleotiderne koblet sammen af 3,5 -fosfodiesterbindinger. I modsætning til DNA et er cellernes RNA-molekyler i udgangspunktet enkeltstrengede, men det er essentielt for deres funktion at de kan baseparre dels med sig selv, dvs. intramolekylært som på skitsen her, dels med andre RNA-molekyler. G U A U A U A G DNA-molekyler er polymerer af deoxyribonukleotider der danner lineære kædemolekyler (polynukleotider) med kovalent binding mellem 3 -OH-gruppen i et nukleotids deoxyribose og nabonukleotidets 5 -fosfatgruppe (Fig. 1.4A). Arvemassens DNA er endvidere dobbeltstrenget, idet molekylerne består af to DNA-polynukleotider som er snoet omkring en fælles akse i en højredrejet dobbelthelix (dobbeltspiral). De to ender af en DNA-streng defineres som hhv. 5 - og 3 -enden, hvor 5 -enden er karakteriseret ved en fri fosfatgruppe på den endestillede deoxyriboses 5 -carbonatom, mens 3 -enden har en fri OH-gruppe på sin endestillede deoxyriboses 3 -carbonatom. Strengene er modsat orienterede (antiparallelle), idet 5 -enden af den ene streng ligger over for 3 -enden af den anden. De to strenge holdes sammen af hydrogenbindinger mellem strengenes baser der på denne måde danner molekylets basepar (Fig. 1.4B): adenin (A) danner par med thymin (T), guanin (G) med cytosin (). De pågældende basepar, AT og G, er karakteriseret ved hhv. to og tre hydrogenbindinger mellem baserne. Som følge af baseparringerne er rækkefølgen af baserne (basesekvensen) i et DNA-molekyles to strenge komplementære: Sekvensen i den ene streng afspejler entydigt sekvensen i den anden. Dette er helt grundlæggende for cellernes opformering og reparation af DNA samt for det laboratoriemæssige arbejde med DNA. DNA-replikation Forud for en celledeling sker der en opformering af cellens DNA (Kap. 2, Fig. 2.1). Denne proces, DNA-replikation, initieres ved bestemte replikationsstartsekvenser (origins of replication) og består af følgende trin: 1. Adskillelse af molekylets to strenge ved brydning af baseparrenes hydrogenbindinger. Dette trin katalyseres af to typer af protein: helikaser og enkeltstrengsbindende proteiner der hhv. åbner dobbelthelixen og holder den åben. 2. Syntese af korte RNA-strenge med DNAenkeltstrengene som skabeloner. For RNA-syntese med DNA som skabelon gælder følgende baseparringsregler: guanin parrer med cytosin, thymin i DNA parrer book.indb 18 09/12/

15 DNA-REPLIKATION A 5 3 G A T G T A G A T A T A G G A T A T G G G T 3 5 Hydrogenbindinger 5 3 O O P O OH H 2 5 O H H 4 1 H H 3 O H 2 O P OH O H 2 5 O G H H 4 1 H H 3 O H 2 O P O O H 2 T 5 O H H 4 1 H H 3 2 O H H O H 2 3 H 1 4 H H O 5 G H 2 O HO HO P P O H O 2 H 3 H 1 4 H H O 5 H 2 O O H O 2 H 3 H 1 4 H H O 5 A H 2 O HO P O O 3 5 B H 2 O H N H N H N H O N N N O Thymin H N Adenin N N N O ytosin H H N N N H Guanin N Figur 1.4. Et DNA-molekyles struktur. A. Til venstre er vist en modeltegning af et dobbeltstrenget DNA-molekyle (en DNA-dobbelthelix). Det består af to DNA-strenge (polynukleotider) snoet omkring en fælles akse så de danner en højredrejet spiral. Strengene holdes sammen af hydrogenbindinger mellem baserne. Til højre er vist den detaljerede opbygning af de to polynukleotider, hvor nukleotiderne i hver DNA-streng er koblet sammen med 3,5 -fosfodiesterbindinger, og baserne (A, G, og T) er kovalent bundet til deoxyriboses carbonatom 1 og derudover via hydrogenbindinger til basepartneren i den anden streng. Pilene angiver strengenes orientering 5 3 og viser at de to strenge er modsat orienterede (antiparallelle). B. DNA s to slags basepar: Adenin (A) danner par med Thymin (T), ytosin () med Guanin (G) vha. hydrogenbindinger. Der er to hydrogenbindinger mellem A og T, og tre hydrogenbindinger mellem G og. med adenin i RNA, og adenin i DNA parrer med uracil i RNA. Den korte RNAstrengs rolle er at fungere som startmolekyle, primer, for den efterfølgende DNAsyntese. RNA-syntesen katalyseres af enzymet DNA-primase, en RNA-polymerase. I modsætning til DNA-polymeraser kræver RNA-polymeraser ikke nogen primer book.indb 19 09/12/

16 KAPITEL 1 MENNESKETS GENOM Boks 1.4 Opklaringen af DNA s dobbelthelix-struktur. I første halvdel af 1900-tallet mente man at nukleinsyrer er opbygget af tetranukleotider, dvs. af gentagne enheder bestående af et af hver af de fire nukleotider som nukleinsyrebaserne repræsenterer. Tetranukleotid-modellen understøttede den opfattelse at de centrale stoffer i arvematerialet var proteiner, da kun de ville kunne rumme den tilstrækkelige variation; måske var DNA en slags støtteskelet for proteinerne. Det blev der sat et stort spørgsmålstegn ved i 1944, da det påvistes at DNA fungerer som arvemateriale i bakterier (Boks 1.2). Dette blev fulgt op af fornyede kemiske studier af DNA, og i slutningen af 1940 erne offentliggjorde den østrigskfødte biokemiker Erwin hargaff ( ) nye målinger af de fire baser i DNA fra forskellige kilder. Resultaterne var uforenelige med tetranukleotidhypotesen, men viste samtidig at DNA indeholder lige meget guanin og cytosin og lige meget adenin og thymin (G/ = A/T = ca. 1); dette blev kendt som hargaffs regel. Derimod varierede forholdet (G+)/ (A+T). Få år senere, i 1953, kom afklaringen af DNA s molekylstruktur gennem et historisk berømt samarbejde mellem den amerikanske biolog James Watson (f. 1928) og den britiske fysiker Francis rick ( ) da det lykkedes dem at bygge en korrekt model af et dobbeltstrenget DNA-molekyle, til dels baseret på røntgenkrystallografiske data opnået af biofysikeren Rosalind Franklin ( ). Først da de løste spørgsmålet om baseparringer mellem adenin og thymin, hhv. guanin og cytosin, blev det klart at hargaffs regel bunder i denne komplementaritet mellem de to strenges basesekvenser. Molekylets dobbeltstrengede struktur med komplementære basesekvenser angav samtidig en umiddelbar mulighed for den opformering af molekylet til to præcise kopier som arvematerialet skal kunne gennemgå. Efter dette gennembrud blev det efterhånden alment accepteret at arvematerialet er DNA. 3. Syntese af nye DNA-strenge sker med udgangspunkt i RNA-primerne og med DNAenkeltstrengene som skabeloner. Her gælder DNA-baseparringsreglerne, og trinnet katalyseres af enzymet DNA-polymerase. Syntesen af en nukleinsyrestreng sker i retningen Afslutningsvis nedbrydes RNA-primerne, og de derved opståede huller i DNA-strengene udfyldes med deoxyribonukleotider. Processen katalyseres af DNA-polymerase. Resultatet af DNA-replikationen er to dobbeltstrengede DNA-molekyler med samme struktur som modermolekylet. I dattermolekylerne stammer den ene streng således fra modermolekylet, mens den anden er nysyntetiseret. DNA-replikationen karakteriseres derfor som semi-konservativ. ellerne har flere forskellige DNA-polymeraser. I cellekernen foretages DNA-replikationen af dels DNA-polymerase α (der indgår i et multimert kompleks med DNA-primasen, se pkt. 2 ovenfor, og overtager syntesen efter denne), dels DNA-polymerase δ der hurtigt afløser DNApolymerase α. Mitokondrierne har deres egen polymerase: DNA-polymerase γ (se s. 122). Boks 1.5. Længdeangivelse af DNA- og RNA-molekyler Længden af dobbeltstrenget DNA angives i basepar (bp): bp betegnes 1 kb (kilobase), 1 mio. bp betegnes 1 Mb (megabase) og 1 mia. bp betegnes 1 Gb (gigabase). Længden af enkeltstrenget nukleinsyre angives i antal nukleotider (nt). Arvematerialets funktion Traditionelt beskrives arvemassen som bestående af diskrete strukturelle og funktionelle enheder kaldet arveanlæg eller gener (Boks 5.1). Vi vil derfor tage udgangspunkt i denne beskrivel book.indb 20 09/12/

17 PROTEINKODENDE GENER Genom Transkriptom Proteom DNA Transkription RNA Translation Protein Replikation Ikkeproteinkodende funktionelt RNA Figur 1.5. Skitse der viser flowet af den genetiske information i en celle. Genomet er cellens samlede genetiske information, transkriptomet er cellens samlede transkripter, og proteomet er den samlede gruppe af proteiner cellen syntetiserer. Angående ikkeproteinkodende funktionelt RNA se Tabel 1.4. se, om end det hurtigt vil vise sig vanskeligt at afgrænse et gen. Den information der rummes i generne, udnyttes forskellige steder i og uden for cellen, samtidig med at genomet forbliver hvor det er. Det problem løses ved at cellerne laver RNA-kopier af genernes DNA og kanaliserer disse kopier derhen hvor deres information udnyttes. Denne RNA-syntese betegnes transkription 1 (eng. transcription, overskrivning; underforstået fra én type nukleinsyre til en anden). Genet bliver transkriberet, og det syntetiserede RNA-molekyle betegnes et transkript. På den baggrund har man defineret et gen som bestående af det DNA-segment der transkriberes, samt de sekvenser af basepar der regulerer transkriptionen. Det er en helt central funktion for genomet at kode for organismens proteiner der i form af enzymer og andre vigtige funktionsmolekyler er ansvarlige for bl.a. de stofskifteprocesser der udgør livsfunktionerne. Det er da også kendskabet til de proteinkodende gener der har størst betydning i den medicinske genetik idet, som det vil fremgå af senere kapitler i bogen, det er ændringer i disse gener og deres funktion der ligger til grund for de mange forskellige kortlagte arvelige sygdomme og for kræftsygdomme. Gennemgan- 1 Bemærk at termen transkription i molekylærbiologi og genetik skrives med kun ét s. Dette i modsætning til retskrivningen inden for humaniora hvor man bruger termen transskription om fx overskrivning af en tekst fra ét alfabet til et andet, eller af et partitur fra en tonart til en anden. gen af genomets opbygning og funktion vil derfor tage udgangspunkt i de proteinkodende gener og deres ekspression, dvs. hvordan de kommer til udtryk. Nyere forskning har vist at den øvrige del af genomet indeholder mange ikkeproteinkodende gener hvis genprodukter (ikkekodende RNA, s. 36) er stærkt involveret i bl.a. reguleringen af de proteinkodende geners ekspression. Denne gruppe af ikkekodende RNA forventes at få stor betydning i den fremtidige medicinske verden. I analogi med termen genom der betegner en celles/organismes arvemasse, har man indført termerne transkriptom og proteom til at betegne en celles/organismes samlede sæt af hhv. transkripter og proteiner. Mens alle kroppens somatiske celler grundlæggende har samme genom, har de ca. 200 forskellige celletyper, som udgør kroppens forskellige væv og organer, i løbet af deres differentiering udviklet hver deres transkriptom og proteom som basis for deres karakteristiske struktur og funktion. Proteinkodende gener Den information der ligger i et proteinkodende gen, er information om det pågældende proteins aminosyresekvens. Der er tale om en fuldstændig grundlæggende information idet et proteins aminosyresekvens afgør proteinmolekylets rumlige struktur og derigennem dets funktion. At denne sekvensinformation kan rummes i genets DNA (og i det tilsvarende RNA-transkript), skyldes at der er en simpel, lineær relation mel book.indb 21 09/12/

18 KAPITEL 1 MENNESKETS GENOM lem basesekvens (i et nukleinsyremolekyle) og aminosyresekvens (i et protein), se Tabel 1.2. Pga. den sproglige forskel mellem nukleinsyrer og proteiner, jf. udtrykket den genetiske kode, betragtes proteinsyntesen informationsmæssigt som en oversættelse fra basesekvens til aminosyresekvens og betegnes i fagsproget en translation (dansk udtale; eng. translation, oversættelse). Genets/transkriptets proteinkodende sekvens translateres til proteinets aminosyresekvens. Det pågældende informationsflow er resumeret i Fig. 1.5; translationsprocessen beskrives nærmere senere (s. 33). Det transkript der bringer en kopi af genets proteinkodende sekvens hen til det sted hvor translationen sker, betegnes messenger-rna eller blot mrna (eng. messenger, bud, kurér). Genstruktur exons og introns Analyserne af det haploide genoms basesekvens har vist at der er et sted mellem og proteinkodende gener i menneskets genom. De varierer meget i størrelse og detailstruktur men har nogle grundlæggende fællestræk (Fig. 1.11). Som model-gen for beskrivelsen af et proteinkodende gens struktur er her valgt et af de små proteinkodende gener: genet for β-globin, hæmoglobinets β-kæde (Fig. 1.6, se også s. 113). De først kortlagte gener i menneskets genom, også hvad DNA-sekvensen angår, var netop de gener der koder for de forskellige hæmoglobiners kæder (Fig. 1.9). Indtil 1977 var det den almindelige antagelse at basesekvensen i et mrna-molekyle er en tro kopi af sekvensen i det pågældende gens ene DNA-streng, blot med den forskel at mrna et har basen uracil i stedet for DNA ets thymin. Men da man efter genteknologiens gennembrud begyndte at kunne kortlægge genernes faktiske størrelse, opdagede man at de allerfleste proteinkodende gener indeholder mange flere basepar end svarende til mrna ets basesekvens. Dette skyldes at den sekvens der er repræsenteret i mrna-sekvensen, på gen-niveau er delt op i et antal delsekvenser (kaldet exons) der er adskilt fra hinanden af kortere eller længere sekvenser (kaldet introns) som ikke er repræsenteret i mrna et, jf. Fig Grænseovergangene mellem exons og introns er karakteriseret ved bestemte sekvenser som er meget ens i næsten alle proteinkodende gener. Man taler således om konsensussekvenser for hhv. 5 - og 3 -afgrænsningerne af introns. I den DNA-streng hvis exonsekvenser er kopieret i mrna-sekvensen, begynder praktisk taget samtlige proteinkodende geners introns med sekvensen GT i 5 -enden, og de ender med AG i 3 -enden. Som navnet konsensussekvens antyder, er der imidlertid tale om stor overensstemmelse i også andre af grænsesekvensernes positioner, se detaljer i Fig Dertil kommer en tredje karakteristisk intronsekvens, den såkaldte forgreningssekvens (eng. branch site, ikke afbildet i Fig. 1.6), som er en kort sekvens med et obligatorisk A lokaliseret ca. 30 baser fra intronens 3 -ende. De nævnte sekvenser er af central betydning for dannelsen af et korrekt mrna for det pågældende gen, se afsnittet Transkription og posttranskriptionel modificering nedenfor. De første og sidste exons i et proteinkodende gen indeholder en kortere eller længere sekvens af basepar som ikke translateres og derfor betegnes UTR (eng. untranslated region, utranslateret region), hhv. 5 UTR og 3 UTR (Fig. 1.6). En UTR kan strække sig over flere exons. Gennemsnitslængden for 5 UTR er ca. 170 bp, mens den for 3 UTR er ca. fire gange større. På mrna-niveau har UTR-sekvenserne forskellige funktioner: 5 UTR indeholder bl.a. en sekvens der er afgørende for initieringen af mrna ets translation; dels for hvilket nukleotid translationen starter ved dvs. hvor den proteinkodende sekvens begynder dels for om translationen initieres hyppigt eller sjældnere (se book.indb 22 09/12/

19 PROTEINKODENDE GENER Promotorsekvenser Transkriptionsstart Transkriptionsstop 3' 5' -75 AAT box -30 TATA box +1 ap ATG site startcodon A Exon 1 A G } AGGT AGT intron 1 intron 2 } Exon 2 (Y) n NYAGG } } Exon 3 TAA stopcodon 5' 3' AATAAA signal for trimning og polyadenylering Konsensus-sekvenser for 5'- (donor) og 3'- (acceptor) splejsningssignaler Transkription og capping ap Exon 1 Exon 2 Exon 3 5' intron 1 intron 2 3' UTR Det primære transkript (præ-mrna) UTR Figur 1.6. Et proteinkodende gens struktur. Som eksempel er her vist en skitse af β-globin-genets struktur, med regulatoriske promotorsekvenser lokaliseret opstrøms for de proteinkodende sekvenser der begynder ved ATG. afsnittet Translation og posttranslationelle modifikationer, s. 33). Derudover kan 5 UTR indeholde sekvenser der fungerer som bindingssteder for proteiner af betydning for mrna ets stabilitet. 3 UTR indeholder dels en såkaldt polyadenyleringssekvens, dels målsekvenser for mikro-rna-betinget regulering af mrna ets translation og evt. nedbrydning (se afsnittene Transkription og posttranskriptionel modificering s. 28 og Mikro-RNA, s. 36). De proteinkodende gener optager ca. 45 % af genomet, men det er bemærkelsesværdigt at det er introns det meste, idet genernes samlede exons, det man betegner organismens exom (jf. genom, transkriptom og proteom), kun udgør ca. 2 % af genomet. Den direkte proteinkodende del af genomet udgør således mindre end 2 %. I de resterende 98 % af genomet forekommer der imidlertid tusindvis af DNA-segmenter som sekvensmæssigt er nært beslægtede med proteinkodende gener, men som pga. forskellige mangler ikke er i stand til at kode for proteiner. De betegnes pseudogener (se det følgende afsnit), og som navnet kan antyde, anså man dem tidligere generelt for at være uden funktion og dermed noget overflødigt DNA (eng. junk DNA) efterladt på evolutionens losseplads. De senere års funktionelle studier af genomet har imidlertid vist at mindst en femtedel af pseudogenerne transkriberes. Boks 1.6 Guinness-rekorder for gener Det største proteinkodende gen i menneskets genom er dystrofin-genet, DMD (Duchenne muscular dystrophy, Duchennes muskeldystrofi, s. 293) som er beliggende på den korte arm af X-kromosomet. Det er på ca. 2,4 Mb (2,4 mio. basepar) og har sit maksimale udtryk i muskelceller hvor det med sine 79 exons koder for muskelproteinet dystrofin på aminosyrerester (Fig. 14.3). Mutationer i DMD er årsag til de X- bundne muskelsvindssygdommene Duchennes mu book.indb 23 09/12/

20 KAPITEL 1 MENNESKETS GENOM skeldystrofi og Beckers muskeldystrofi. Et andet muskelprotein, titin, har med sine ca aminosyrerester rekorden som det største protein der kodes for i genomet. Genet, TTN, er på knap 300 kb og har det største antal exons (363), hvoraf en er den størst kendte (lidt over 17 kb). Pseudogener Pseudogener er generelt ikkefunktionelle DNAsegmenter som ligner funktionelle gener. Man skelner mellem processerede (eng. processed, forarbejdede) og ikkeprocesserede pseudogener. De to typer pseudogener adskiller sig fra hinanden i både struktur og tilblivelse. Forskellen er den at et ikkeprocesseret pseudogen minder meget om det tilsvarende funktionelle gen idet det har en tilsvarende exon/intron-struktur samt regulatoriske sekvenser som fx promotoren. Det antages da også at være opstået ved duplikation af det funktionelle gen og efterfølgende inaktiveret af mutationer i DNA-sekvensen, jf. pseudogenerne i globin-genklyngerne (Fig. 1.9). Hvis der kun er tale om kopi af en mindre del af det funktionelle gen, fx en enkelt exon, taler man om et genfragment. Et processeret pseudogen indeholder hverken intron- eller promotor-sekvenser. Det antages derfor at være dannet såkaldt revers transkription, dvs. ved transkription af mrna til DNA, og efterfølgende integrering af DNA-kopien i genomet. Det kan i nogle tilfælde ske at et processeret pseudogen transkriberes fordi det tilfældigvis er blevet sat ind tæt på en promotor. I så tilfælde betegnes pseudogenet et retrogen. Det autosomale gen for enzymet fosfoglyceratkinase (PGK2) på kromosom 6p er formentlig et sådant retrogen. Det er interessant at ekspressionsmønstret for dette gen er meget forskelligt fra det oprindelige X-bundne gens (PGK1). PGK2 udtrykkes kun i testes, mens PGK1 udtrykkes i alle øvrige væv. Den testisspecifikke ekspression af PGK2 er formentlig en kompensatorisk reaktion på inaktivering af det X-bundne PGK1 i det spermatogenetiske væv inden meiosen. Genernes fordeling i genomet Hvis de proteinkodende gener var jævnt fordelt i genomet, ville der være ét gen pr kb genomsekvens. Imidlertid er gentætheden meget varierende inden for et kromosom og fra kromosom til kromosom (Tabel 1.1). Subtelomer-regionerne, dvs. regionerne kb centromert for telomererne (se Fig. 1.7B), er de områder i genomet der har den største gentæthed. De fleste geners transkriberede segmenter ligger i en vis A B Kromatid Telomer entromer Subtelomer region kb 12 kb Telomerassocierede Telomer repeats AGGGTTAGGGTTAGGGTTAGGGTTAGGGTTAG... TAATAATAATAAT 3 5 Figur 1.7. A. Skitse af et metafasekromosom. Kromosomet består af to kromatider der holdes sammen i den region der betegnes centromeret. Regionerne i enderne af kromatiderne betegnes kromosomets telomerer. B. Skitse af et kromatids telomerregion. De terminale afsnit med ca. 12 kb DNA udgør telomeren. entromert herfor ligger en region med kb DNA bestående af telomer-associerede repeats (Tabel 1.6), og yderligere centromert herfor ligger den såkaldte subtelomerregion, en region der er forholdsvis rig på gener.. Skitse af et kromatid med angivelse af den ene telomerregion og et udsnit af det telomere DNA s basesekvens. DNA et består af et par tusind tandemrepeterede enheder à seks basepar (indrammet) book.indb 24 09/12/

21 PROTEINKODENDE GENER 3 5 Neurofibromatose type 1-genet Intron 35 OMG EVI2B EVI2A 5kb 5 3 Figur 1.8. Skitse af tre proteinkodende gener (OMG, EVI2A og EVI2B) beliggende i genet NF1 s intron 35. Som skitseret har hvert af de tre små gener exons og introns. Generne er skitseret på deres template-streng, og pilene viser transkriptionsretningen. OMG = oligodendrocyte myelin glycoprotein; EVI2 = ectopic viral integration site 2. afstand fra hinanden, men man har også fundet mange overlappende gener, især i områder med høj gentæthed. Nogle gange er overlappet partielt, mens det i andre tilfælde er fuldstændigt. Fx indeholder genet NF1 (det gen der i muteret form er årsag til neurofibromatose type 1) i intron 35 tre mindre gener, OMG, EVI2A og EVI2B (Fig. 1.8). Hvert af disse tre gener er igen opdelt i egne exons og introns, og deres transkriptionsretning er den modsatte af værtsgenets. Der er også eksempler på at gener for ikkekodende RNA overlapper proteinkodende gener. Den ulige fordeling af generne i genomet har man kendt til siden opdagelsen af at Giemsafarvning af kromosomerne giver et kromosomspecifikt båndmønster (Fig. 1.2). ytogenetiske undersøgelser sammenholdt med kliniske observationer tydede på at der var færre gener i de mørke G-bånd og som følge heraf at gentætheden i de lyse bånd måtte ligge over gennemsnittet for genomet. En forudsigelse som er blevet bekræftet ved kortlægningen af genomet. De mange forskellige gener hos mennesket kan for nogles vedkommende inddeles i multigen-familier og super-familier, afhængigt af om de fungerer i samme funktionelle reaktionsveje (pathways), og af om de har større eller mindre grad af sekvensidentitet. Som eksempler på multigen-familier, hvor generne ligger i relativt tætte klynger (eng. clusters) og har et evolutionært og funktionelt fællesskab, kan nævnes histon-multigen-familien på kromosom 6p samt α- og β-globin-generne på hhv. kromosom 16p og 11p (Fig. 1.9). Globin-genklyngerne er efter alt at dømme resultatet af gentagne duplikationer i løbet af hvirveldyrenes evolution gennem de seneste 500 millioner år. Disse to klynger af gener koder for hæmoglobin-kæder der udtrykkes på forskellige udviklingstrin fra det tidlige embryon til det fødte individ. Til denne familie hører også genet for det muskelspecifikke globin, myoglobin, på kromosom 22q. Som eksempel på en superfamilie, hvor generne i genomet både ligger spredt og i klynger, kan nævnes immunglobulin-gen-superfamilien der består af gener på kromosom 6p (HLA-vævstype-antigen-komplekset), kromosomerne 7p, 7q og 14q (T-celle-receptor-gener) og på kromosomerne 2p, 14q og 22q (gener for immunglobulinernes tunge og lette kæder). α-globin-genklyngen Kromosom 16p ζ ψζ ψα2 ψα1 α2 α1 θ 5 3 β-globin-genklyngen Kromosom 11p ε Gγ Aγ ψβ δ β kb Figur 1.9. Genklyngerne for α- og β-globinfamilierne. Begge klynger indeholder gener som udtrykkes på forskellige trin i udviklingen: ζ- og ε-globingenerne udtrykkes embryonalt, γ-globingenerne føtalt sammen med α-globingenerne, og sent føtalt afløser ekspression af β-globingenet γ-globingenerne, således at stort set kun α- og β-globingenerne udtrykkes efter fødslen ved syntese af hæmoglobin A (α 2 β 2, s. 113); δ-globingenet har et lavt ekspressionsniveau, jf. hæmoglobin A2 (α 2 δ 2 ). Genklyngerne indeholder flere pseudogener (hvide symboler) book.indb 25 09/12/

22 KAPITEL 1 MENNESKETS GENOM Tabel 1.1 Det haploide humane genom. DNA-indhold samt antal gener i hvert kromosom. Fra National enter for Biotechnology Information (NBI), Human Genome Project, oktober 2010 Kromosom Mb DNA % af genomet Samlede antal gener Antal gener/mb* % af gener i alt , ,1 13, , ,1 4, , ,8 4, , ,3 1, , ,4 1, , ,3 7, , ,4 6, , ,6 3, , ,7 6, , ,3 5, , ,8 1, , ,8 4, , ,1 2, , ,7 4, , ,2 2, , ,2 2, , ,2 5, , ,8 1, , ,3 4, , ,3 3, , ,3 1, , ,8 3,4 X 155 5, ,9 5,7 Y 58 1, ,8 1, , ,45 100,0 * Bemærk variationen i gen-tætheden på de enkelte kromosomer Figur Transkription og translation. A. Skitse af transkription af DNA, dvs. syntese af RNA med den ene DNA-streng som skabelon (template). Syntesen foretages af en RNA-polymerase der rekrutteres til opgaven af specielle proteiner kaldet transkriptionsfaktorer. Den sker i retningen 5 3, dvs. komplementært til 3 5 -retningen på den DNA-streng der fungerer som template. B. Skematisk afbildning af princippet i translation af messenger-rna (mrna). Tre på hinanden følgende baser i mrna (en triplet) udgør en kodeenhed (codon) for en given aminosyre, jf. den genetiske kode (Tabel 1.2), og basesekvensen afkodes i en ubrudt læseramme af ikkeoverlappende codons i retningen 5 3, begyndende ved startcodon (AUG, koder for aminosyren methionin). Afkodningen formidles af aminosyrespecifikke ladede trna-molekyler vha. disses anticodon som baseparrer med den tilsvarende codon (se flere detaljer i delfigur d samt i afsnittet trna, s. 34), og trin for trin kobles aminosyrerne sammen ved etablering af peptidbindinger under dannelse af det pågældende polypeptid/protein.. Skitse af et translationsforløb. Translationen formidles af ribosomer, og man definerer tre delprocesser i translationen: initiering, elongering og terminering. Hvert af disse trin formidles og reguleres af forskellige proteiner samt af ribosomalt RNA, herunder katalytisk aktivt rrna (ribozym). Se flere detaljer i afsnittet Translationen, s. 35. D. trna-molekylers struktur, her illustreret ved trna for aminosyren fenylalanin (trna Phe ), dels i stiliseret todimensionel struktur (såkaldt kløverbladsform), dels på skitseret naturtro tredimensionel form. Acceptor-armen (3 -enden af molekylet) tilhæftes den specifikke aminosyre, jf. anticodon (her 3 -AAG-5 der kan parre med de to fenylalanincodons, se Tabel 1.2. I RNA kan G parre med både og U). De tomme felter i kløverbladsformens basesekvens angiver modificerede nukleotider af forskellig slags book.indb 26 09/12/

23 TRANSKRIPTION OG POSTTRANSKRIPTIONEL MODIFIERING A. Transkription RNA 5' 3' 3' 3' DNA-dobbelthelix 5' B. Translation Methionin Glycin Serin Isoleucin Glycin Alanin Polypeptid G G T A U G G G U A U G G G A G A A G 5' ' mrna odons. Translationsforløb 5' A U G G G U A U G G G U A G U U A A U 3' U A Ribosom G Ribosom A G G U A Ribosom Met Met Gly Ser Phe Leu Met Ser 1. Initiering 2. Elongering 3. Terminering D. Strukturen af transfer-rna (trna) 1. Kløverbladstruktur G A U Loop 1 G G G A G A G 5' A 3' A G G G A U U G U U A A G A A U U G U G Loop 3 G U A G G Variabel loop G U U A A G A Loop 2 A U G A A Anticodon 2. Tredimensionel struktur Loop 3 20 Variabel loop Anticodon-loop (Loop 2) ' Loop 1 Anticodon ' Acceptorende book.indb 27 09/12/

24 KAPITEL 1 MENNESKETS GENOM Transkription og posttranskriptionel modificering Princippet i en transkription er skitseret i Fig. 1.10A. Ligesom DNA-syntese sker RNA-syntese i retningen 5 3 med den ene af genets DNA-strenge som skabelon (template-strengen), men i modsætning til DNA-polymeraser kræver RNA-polymeraser ikke primer. Ved transkriptionen skelnes der ikke mellem exons og introns. Der syntetiseres således ét langt RNA-molekyle med en kontinuert basesekvens af både exons og introns, ligesom i genet. Dette såkaldt primære transkript er et forstadium til mrna et og betegnes præ-mrna (Fig. 1.6). Bortset fra at RNA har uracil hvor DNA har thymin, er basesekvensen i præ-mrna et lig med sekvensen i den DNA-streng der er komplementær til template-strengen, og som derfor også ofte kaldes den RNA-lignende streng. Processen begynder med binding af såkaldte generelle transkriptionsfaktorer til bestemte sekvenser i kort afstand fra det segment der skal transkriberes. Sekvenser der binder generelle transkriptionsfaktorer, betegnes promotorer (igangsættere, af lat. promovere, sætte i gang). Gener der koder for celle/vævsspecifikke proteiner, er karakteriseret ved en promotor betegnet TATA-boksen (5 -TATAAAA-3 ) beliggende bp opstrøms for transkriptionsstart, mens de såkaldte husholdningsgener, dvs. gener der koder for proteiner i det fælles basale intermediære stofskifte, er kendetegnet ved en eller flere såkaldte G-bokse (5 -GGGGG-3 ) i varierende afstand fra transkriptionsstart. Et andet almindeligt promotor-element er den såkaldte AAT- eller AT-boks (5 -AAT-3 ) bp opstrøms for transkriptionsstart. Samlet betegnes promotorsekvenserne genets promotorregion (Fig. 1.6 og 1.11). Efter bindingen til promotor-regionen rekrutterer og aktiverer transkriptionsfaktorerne den RNA-polymerase (RNA-polymerase II) som transkriberer proteinkodende gener. Derudover kan der være regulatoriske sekvenser lokaliseret længere opstrøms eller nedstrøms, evt. i en afstand af flere hundredtusind basepar fra β-globin»at« ,5 1,0 1,5 2,0 kb»tata«hprt »G-rig« kb Faktor VIII kb»tata«figur Skitser af tre forskellige proteinkodende gener. Bemærk de forskellige størrelsesskalaer (hhv. ca. 2 kb, 50 kb og 200 kb) og exon/intron-fordelinger. Genernes exons er nummererede. AT, TATA og G-rig angiver regulatoriske elementer i genernes promotorregioner, jf. Fig book.indb 28 09/12/

25 TRANSKRIPTION OG POSTTRANSKRIPTIONEL MODIFIERING Figur Modelskitse af initieringskompleks ved transkription af et proteinkodende gen. Figuren illustrerer binding af generelle transkriptionsfaktorer og RNA-polymerase II (den muselignende figur) til genets promotorregion (med TATAboks) samt stimulering af komplekset ved yderligere tilknytning af et aktivatorprotein, bundet til en enhancer-sekvens i stor afstand fra promotorregionen, men bragt i fysisk nærhed af denne ved slyngedannelse (looping) af DNA et. Noget tilsvarende gælder for silencer-sekvenser og dertil knyttede transkriptionshæmmende proteiner. promotorregionen. Det er bindingssteder for såkaldte specielle transkriptionsfaktorer som interagerer med RNA-polymerase-komplekset i promotorregionen. At dette kan lade sig gøre, selv over store afstande, skyldes DNA-molekylernes fleksibilitet (looping, se Fig. 1.12). På den måde kan de DNA-bundne specielle transkriptionsfaktorer fysisk nå proteinkomplekset i promotorregionen og dermed påvirke rekrutteringen af RNA-polymerasen i positiv eller negativ retning, dvs. fungere som det der betegnes enhancers (positive; eng. forstærkere) hhv. silencers (negative; eng. (lyd)dæmpere). Det er promotorerne der afgør hvilken DNAstreng der bliver skabelon for RNA-syntesen, samt hvor syntesen skal begynde (transkriptionsstart, Fig. 1.6 og 1.12). Mange af de proteinkodende gener hos mennesket har to eller flere alternative promotorregioner, typisk forskellige mht. binding af vævs- og udviklingsstadiespecifikke transkriptionsfaktorer. Der er fx beskrevet mindst 8 forskellige promotorer i dystrofin-genet, DMD (Fig. 1.13, Boks 1.6), hvor den promotor der er lokaliseret nærmest genets 3 -ende (den generelle promotor, G) er den mest aktive i ikkemuskelceller, fx i hjernen. Alternativt promotorbrug er en af grundene til at forskellige celletyper kan danne forskellige mrna er og dermed funktionelt forskellige isoformer af et givet protein ud fra samme gen. apping og polyadenylering Straks efter transkriptionens start modificeres transkriptets 5 -ende ved påsætning af et guaninribonukleotid hvis 5 -fosfat bindes til transkriptets 5 -fosfat hvorved 5 -enden får en fri 3 -OH-gruppe, ligesom 3 -enden. Dette endestillede specielle nukleotid, der derefter metyleres i guanindelens position 7 (m 7 GpppN) 2, betegnes cap (eng. kasket). Etableringen af cap en kaldes capping og er et særkende for RNA syntetiseret af RNA-polymerase II. ap en beskytter molekylet mod enzymatisk nedbrydning og har endvidere betydning for initieringen af translationen. 2 m 7 G = 7-methyl-guanosin; p = fosfat; N = 5 -nukleosidet (base+ribose) i det umodificerede primære transkript book.indb 29 09/12/

26 KAPITEL 1 MENNESKETS GENOM L M P R NS S G kb L1 1 M1 P Dp427 Dp260 Dp140 Dp116 Dp71 Figur Alternative promotorer. Skitse af dystrofin-genet (DMD) med angivelse af de otte forskellige promotorer som betinger genets cellespecifikke ekspressionsformer. Øverste delfigur viser promotorernes positioner i det over kb store gen. Pilene angiver transkriptionsstart og -retning. Bogstavsymbolerne angiver det væv den pågældende promotor er aktiv i: L lymfocytter, hjernebark (cortex cerebri), M muskelceller, P purkinjeceller (lillehjernen), R retina, NS centralnervesystemet, S schwannske celler. G står for generel og er aktiv i mange andre celler end skeletmuskelceller (hjerne, retina, nyre, lever, lunge samt hjertemuskelceller). Den nederste delfigur viser en skitse af genet med exons og introns indtegnet sammen med de fire af promotorerne fra øverste delfigur. Det er den aktive promotor der afgør transkriptionsstart. Dp-symbolerne refererer til de forskellige genprodukters størrelse i kda (kilodaltons). Jo længere inde i genet transkriptionen starter, jo mindre bliver genproduktet. Efter afslutningen af transkriptionen modificeres også transkriptets 3 -ende idet den førnævnte polyadenyleringssekvens i 3 UTR (hyppigst sekvensen 5 -AAUAAA-3, Fig. 1.6) binder et enzymkompleks der formidler fraspaltning af den sidste del af transkriptet, ved kløvning af molekylet ca. 30 nukleotider nedstrøms for polyadenyleringssekvensen, og efterfølgende polyadenylering. Polyadenylering består i en forlængelse af transkriptet ved syntese af en 3 -hale på ca. 200 adeninribonukleotider, poly(a). Poly(A)-halen er af betydning for stabiliteten af mrna et samt for dets transport ud af kernen og efterfølgende translation (se afsnittet Translationen, s. 35). Ligesom et gen kan have flere forskellige promotorregioner, kan det have mere end ét polyadenyleringssignal, og alternativ polyadenylering er endnu en måde hvorpå forskellige celler kan danne forskellige mrna-molekyler ud fra samme gen. Typisk er der tale om alternative polyadenyleringssekvenser i 3 UTR og dermed om dannelse af mrna-molekyler med forskellige længder af denne sekvens. Dette kan have betydning for hvilke mikro-rna er der kan bindes til mrna et, og dermed for molekylets stabilitet i den pågældende celletype. I nogle geners transkripter kan en ekstra polyadenyleringssekvens være lokaliseret opstrøms for 3 UTR således at de alternative polyadenyleringer resulterer i mrna er med forskellige proteinkodende sekvenser. Alternativ polyadenylering er fx afgørende for om en B-lymfocyt syntetiserer antistofmolekyler der fastholdes i cellemembranen (ustimuleret lymfocyt) eller udskilles (antigenstimuleret lymfocyt). Splejsning, herunder alternativ splejsning Den mest dramatiske posttranskriptionelle proces er fjernelsen af transkriptets intronsekvenser, samtidig med at exonsekvenserne samles til én enkelt proteinkodende sekvens under dannelse af det såkaldt modne mrna. Denne proces betegnes splejsning (eng. splicing) og formidles af et splejsosom (eng. spliceosome), en ansamling af fem ribonukleoproteinkomplekser, dvs. komplekser af RNA og protein. Kompleksernes RNA-molekyler er forholdsvis små (< 200 nt) og tilhører den familie af RNA der betegnes snrna (small nuclear RNA). De fem snrna-protein-kom book.indb 30 09/12/

27 TRANSKRIPTION OG POSTTRANSKRIPTIONEL MODIFIERING plekser har hver sit snrna og betegnes hhv. U1, U2, U4, U5 og U6 (U for uracil som deres snr- NA-molekyler er rige på). 3 Splejsningsprocessen er en kompliceret proces som her kun skal resumeres groft. Den er baseret på dels baseparring mellem snrna og splejsningssekvenser (splice sites) i præ-mrna samt mellem splejsosomkompleksernes snrna-molekyler indbyrdes, dels binding af forskellige hjælpeproteiner til præ-mrna. Sammen med hjælpeproteinerne scanner splejsosomet præ-mr- NA et, og herunder bindes primært U1 og U2 til hhv. splejsningssignalet ved 5 -enden af introns og forgreningssekvensen. Derefter rekrutteres de tre øvrige splejsosomkomplekser, og det samlede splejsosom bliver katalytisk aktivt. Præ-mRNA et kløves i exon/intron-overgangen i intronens 5 -ende der kovalent bindes til forgreningssekvensens A hvorefter intron/exon-overgangen i 3 -enden kløves, og de flankerende exons splejses sammen. Mutationer der påvirker splejsningen, udgør en væsentlig del af de patogene mutationer, se afsnittet Splejsningsmutationer, s Mange præ-mrna er bliver splejset på to eller flere forskellige måder hvorved forskellige exon-kombinationer bliver inkluderet i det færdige transkript, typisk ved at en eller flere exons udsplejses samtidig med introns, evt. at dette gælder den ene af to på hinanden følgende exons der således optræder alternativt i mrnamolekylerne. Fænomenet betegnes alternativ splejsning og har til resultat at samme primære transkript bliver ophav til flere forskellige slags mrna. Alternativ splejsning er den vigtigste årsag til at organismen kan danne mange flere forskellige proteiner end der er proteinkodende gener (Fig og 1.15). Ligesom alternativt promotorbrug og alternativ polyadenylering reguleres alternativ splejsning af forskellige proteiner som kan fremme eller hæmme udnyttelsen af splejsningssekvenserne for de enkelte exons. Det forhold at sådanne regulerende proteiner udtrykkes forskelligt i forskellige celletyper, bevirker at der bliver tale om cellespecifikke splejsningsprofiler og derigennem cellespecifikke mrna-profiler (transkriptomer) og proteinprofiler (proteomer) sv.t. uddifferentieringen af forskellige celletyper. Ud over at resultere i dannelse af forskellige protein-isoformer kan alternativ spejsning resultere i forskelle i mrna-molekylernes UTRsekvenser. Dette kan have stor funktionel betydning pga. 3 UTR s tidligere omtalte rolle i den mikro-rna-betingede regulering af genekspressionen posttranskriptionelt (s. 23). Potentialet for alternativ splejsning fremgår bl.a. af en analyse af det neuronspecifikt udtrykte gen Dscam hos bananfluer 4 hvor man har påvist at dets præ-mrna potentielt kan splejses på ca forskellige måder hvilket giver mulighed for en cellespecifikt udtrykt isoform af det pågældende protein (et celleadhæsionsmolekyle) i hvert af nervesystemets neuroner. Præ-mRNA U3 er involveret i splejsning af præ-rrna. 4 Det homologe gen hos mennesket, DSAM, blev fundet først. Det er beliggende på kromosom 21q og har været sat i forbindelse med Downs syndrom, jf. genets navn som er et akronym af den betagnelse man har givet det protein genet koder for: Downs syndrome cell adhesion molecule. Figur Skitse af alternativ splejsning hvor det ene mrna indeholder exons 1 og 2, men ikke 3, medens det andet indeholder exons 1 og 3, men ikke 2. Til højre i figuren er skitseret hvorledes de resulterende proteiner kan have forskellige rumlige strukturer der kan afspejle funktionelt forskellige proteiner pga. deres forskellige funktionelle domæner book.indb 31 09/12/

28 KAPITEL 1 MENNESKETS GENOM A α-tropomyosin-gen DNA Transkription + splejsning Muskel-mRNA 3 Glat muskel-mrna 5 3 Fibroblast-mRNA 5 3 Fibroblast-mRNA 5 3 Hjerne-mRNA Dette protein syntetiseres i leveren og i tarmepitel. I leveren har proteinet en længde på aminosyrer, mens det i tarmepitel kun er knap halvt så langt. Forklaringen er at der ved RNAeditering i tarmepitelet skabes et translationsstop tidligt i apob-mrna idet der sker en dea- B alcitoningenet Gl. thyroidea Neuronalt væv pa 1 pa a 5b Gl. thyroidea Differentiel splejsning og polyadenylering Neuronalt væv mrna ap Poly- A ap a 5b Poly- A Translation Polypeptidforstadium Post-translationel kløvning Polypeptid alcitonin GRP Figur Skitse af alternativ splejsning med cellespecifikke splejsningsmønstre. A. Skitse af genet for proteinet alfa-tropomyosin og dets forskellige cellespecifikke alternativt splejsede primære transkripter. I skitsen angiver de helt lyse felter genets introns. Den isoform af proteinet der syntetiseres i muskelceller, er involveret i muskelkontraktion, mens de andre celletypers isoformers rolle er uklar. De små pile angiver polyadenyleringssekvenser. B. ellespecifik alternativ polyadenylering og splejsning af calcitoningenets transkript. pa 1 og pa 2 angiver polyadenyleringssekvenser der anvendes i hhv. gl. thyroidea og nervevæv. Det funktionelle protein, calcitonin, som syntetiseres i gl. thyroidea kodes af exon 4, mens genproduktet GRP (calcitonin-gen-relateret protein) i nervevæv kodes af 5 -delen af exon 5 (5a). RNA-editering Ved RNA-editering (RNA editing) forstår man en enzymatisk betinget deaminering af bestemte baser i visse transkripter. Lærebogseksemplet er deaminering af et ganske bestemt cytosin () til uracil (U) i mrna for apolipoprotein B (apob) book.indb 32 09/12/

29 DEN GENETISKE KODE minering af cytosinet i codon nr så denne ændres fra AA (codon for aminosyren glutamin) til UAA (en stopcodon) (Tabel 1.2; mht. codon-begrebet, se afsnittet Den genetiske kode nedenfor). En anden type RNA-editering er deaminering af adenin til hypoxanthin (adenosin til inosin). Dette er især påvist i forbindelse med syntese af mikro-rna er (s. 36) hvor man har fundet at en sådan RNA-editering af de dobbeltstrengede forstadier kan resultere i ændret stabilitet (nedbrydning) eller specificitet (ændret målsekvens). Den genetiske kode Et proteins aminosyresekvens bestemmes af basesekvensen i det pågældende mrna s proteinkodende segment, således at tre på hinanden følgende baser koder for en given aminosyre, jf. Tabel 1.2. De tre baser siges at udgøre en triplet, og den således kodende enhed betegnes en codon. De fire forskellige baser i RNA muliggør i alt 64 forskellige tripletter. Heraf fungerer de 61 som aminosyrecodons, den ene AUG (codon for methionin) også som startcodon, dvs. den første triplet i den proteinkodende sekvens. Tripletterne UAA, UAG og UGA fungerer som stopcodons, dvs. at det er en af dem der markerer afslutningen på den proteinkodende sekvens (se dog Tabel 1.2 vedrørende undtagelser for UGA). To af aminosyrerne (methionin og tryptofan) har kun én codon, de fleste har to eller fire, men tre aminosyrer (leucin, serin og arginin) har seks codons. I mrna et fastlægger startcodon den læseramme (eng. reading frame) der benyttes ved translationen, idet aflæsningen sker kontinuert triplet for triplet (se Fig samt afsnittet Translationen ). Tabel 1.2 Den genetiske standardkode Anden base Første base Den genetiske standardkode er dén genetiske kode der gælder for de allerfleste arters nukleære genom. Den blev dechifreret i 1960 erne. For mitokondriegenomets genetiske kode se Tabel 1.8. Kode-enheden betegnes en codon og består af tre baser, her gengivet på mrna-niveau. Basesekvensen i en codon er orienteret 5 3. I tabellen er anført trebogstavkoderne for de aminosyrer de forskellige codons/codonfamilier koder for, se Tabel 1.3 (side xx). Tre af tripletterne UAA, UAG og UGA er stopcodons, dog fungerer UGA i et lille antal nukleære geners mrna som codon for den selenholdige aminosyre selenocystein. Tredje base Translation og posttranslationelle modifikationer Ribosomer Den mrna-baserede proteinsyntese finder sted på cytoplasmatiske organeller der betegnes ribosomer. Det er store ribonukleoproteinkomplekser (ca. 70 % RNA og 30 % protein) som hver består af en lille og en stor underenhed (subunit). Den type RNA der indgår i ribosomerne, betegnes ribosomalt RNA (rrna). Mitokondrierne har deres eget translationsapparat som vil blive omtalt på s. 48 i afsnittet mtdnamolekylet og dets funktion. Den følgende beskrivelse gælder translationen af nukleært kodet mrna book.indb 33 09/12/

30 KAPITEL 1 MENNESKETS GENOM Tabel 1.3 Tre- og étbogstavkoder for de 21 aminosyrer der indgår i translationen Aminosyre Trebogstavkode Étbogstavkode Alanin Ala A Arginin Arg R Asparagin Asn N Asparaginsyre Asp D ystein ys Fenylalanin Phe F Glycin Gly G Glutamin Gln Q Glutaminsyre Glu E Histidin His H Isoleucin Ile I Leucin Leu L Lysin Lys K Methionin Met M Prolin Pro P Selenocystein Sec U Serin Ser S Threonin Thr T Tryptofan Trp W Tyrosin Tyr Y Valin Val V Der indgår fire forskellige slags rrna i ribosomerne, betegnet hhv. 5S, 5,8S, 18S og 28S rrna. Tre af disse (28S, 5,8S og 5S rrna) 5 indgår, sammen med ca. 50 forskellige proteiner, i ribosomets store subunit, og det fjerde (18S rrna) indgår, sammen med ca. 30 forskellige proteiner, i den lille subunit. Vha. udtalt intramolekylær baseparring er rrna-molekylerne fol- 5 S står for Svedberg som er enheden for sedimentationsrate ved ultracentrifugering. Raten afhænger bl.a. af molekylernes størrelse. De fire rrna er er hhv. ca. 120, 160, og nukleotider lange. Theodor Svedberg ( ) var en svensk kemiker; han fik nobelprisen i kemi i 1926, bl.a. for sin opfindelse af ultracentrifugen. det op i meget kompakte tredimensionelle strukturer der stabiliseres af proteinmolekylerne og gør ribosomet katalytisk aktivt (Boks 1.7). Der findes flere hundrede 5S rrna-gener, de fleste i genklynger på kromosom 1. De tre øvrige rrna-molekyler (18S, 5,8S og 28S) udsplejses fra hhv. 5 -enden, midten og 3 -enden af prærrna, et ca nukleotider langt transkript af et gen der i diploide celler foreligger i ca. 400 kopier fordelt på genklynger i DNA et i de korte arme af de akrocentriske kromosomer. Boks 1.7 Ribozymer Splejsning er et af mange eksempler på at RNA kan katalysere forskellige kemiske processer, enten alene eller i samspil med proteiner. Katalytisk aktive RNAmolekyler og ribonukleoproteinkomplekser betegnes ribozymer (ribonukleinsyre-enzymer). Splejsosomer og ribosomer er eksempler på vitale ribozymer. Inden udsplejsningen modificeres transkriptet massivt ved dels metylering af ribosens 2 -OH i ca. 100 af nukleotiderne, dels isomerisering af ca. 100 af uridin-nukleotiderne til pseudouridinnukleotider (ændret binding mellem uracil og ribose). Både disse modifikationer og udsplejsningen af de tre rrna-molekyler formidles af forskellige ribonukleoproteinkomplekser med små RNA-molekyler der betegnes snorna (small nucleolar RNA), fordi disse processer finder sted i den struktur i cellekernen der betegnes nukleolen (nucleolus, kernelegemet). Det er også her ribosomernes ribonukleoproteinkomplekser efterfølgende samles. trna Ud over mrna og rrna indgår der en tredje speciel kategori af RNA-molekyler i translationen: trna (transfer-rna eller transport-rna), som er de RNA-molekyler der bringer aminosyrerne til mrna et. For hver af de aminosyrer book.indb 34 09/12/

31 TRANSLATION OG POSTTRANSLATIONELLE MODIFIKATIONER der indgår i proteinsyntesen, er der mindst ét specifikt trna mindst to for de aminosyrer der har mere end fire codons (Tabel 1.2); for aminosyren methionin er der to forskellige trna er, hvoraf det ene er specifikt for initieringen af translationen og derfor betegnes initiator-trna. I alt er der i cellerne ca. 50 forskellige trna er, kodet af i alt ca. 500 gener i genomet. Genernes umiddelbare transkripter, prætrna, gennemgår en række ændringer i form af trimning og kemisk modificering af bestemte nukleotider, og de modne trna er er små kompakte molekyler (ca. 80 nukleotider lange) der vha. interne baseparringer er foldet op i en karakteristisk ensartet rumlig form (Fig. 1.10D). Aminosyren esterbindes via sin carboxylgruppe til sit trna s 3 -OH-gruppe under dannelse af aminoacyl-trna ( ladet trna ). Dette formidles af en aminoacyl-trna-syntase, et enzym der specifikt genkender både den rigtige aminosyre og det rigtige trna. Den pågældende aminosyres rette placering under proteinsyntesen sker ved baseparring mellem de tre baser i aminosyrens codon i mrna et og en triplet af uparrede baser i det ladede trna, den såkaldte anticodon (Fig. 1.10B og ). Translationen Det er altafgørende for translationen at den begynder det rigtige sted i mrna-sekvensen, dvs. ved den proteinkodende sekvens startcodon. Et segment af en nukleotidsekvens kan i princippet læses i tre forskellige læserammer, men kun én af dem er rigtig, nemlig den der er defineret af startcodon (som følge heraf har nysyntetiserede polypeptider methionin som N-terminal aminosyre, Fig. 1.10B og ). Translationen af mrna sker fra startcodon i retningen 5 3, og proteinsyntesen tilsvarende i retningen fra N-terminal aminosyre (fri aminogruppe) mod -terminal (fri carboxylgruppe). Den AUG-triplet der er startcodon, er oftest den der er nærmest mrna ets 5 -ende, men kun hvis den er markeret af de rigtige omgivelser som fremgår af den konsensussekvens for translationsstart man har påvist: 5 -RccAUGG-3 (Kozaksekvensen), hvor R betyder purin (A eller G) og AUG er startcodon. A et i startcodon er således den første base i den proteinkodende sekvens og gives positionen +1. For at virke som et stærkt startsignal skal sekvensen omkring startcodon være som konsensussekvensen, dvs. der skal både være en purin i position -3 (der er ingen position 0) og et G i position +4. De to er i positionerne -1 og -2 er ikke så afgørende hvorfor de skrives med småt i konsensussekvensen. Proteinsyntesen kan som proces inddeles i tre trin (Figur 1.10): 1) Initiering (start), hvor der dannes et initieringskompleks bestående af den lille ribosom-subunit, ladet initiator-trna og mrna. Den store ribosom-subunit tilknyttes ikke før det ladede initiator-trna har fundet startcodon i mrna et. Dannelsen af initieringskomplekset kræver forskellige initieringsfaktorer, bl.a. for binding af mrna et til den lille ribosom-subunit via dets cap og for fysisk tilnærmelse mellem cap en og mrna ets poly(a)-hale, hvilket stimulerer initieringen og muligvis også genbruget af ribosomerne efter endt translation. 2) Elongering (forlængelse, dvs. syntese af proteinets aminosyrekæde). Denne proces består af codon-genkendelse (binding af ladet trna), etablering af peptid-binding (katalyseret af 28S rrna, se Boks 1.7) og afslutningsvis forskydning translokering af mrna et sv.t. tre nukleotider; dette trin kræver elongeringsfaktorer. 3) Termineringen (stop) er det sidste trin og indledes når der optræder en stopcodon i læserammen. En stopcodon kan ikke baseparre med nogen af trna-molekylerne, men genkendes af et bestemt protein, en frisætningsfaktor (eng. release factor), hvis binding til translationskomplekset bevirker at det syntetiserede polypeptid frigøres book.indb 35 09/12/

32 KAPITEL 1 MENNESKETS GENOM Posttranslationelle modificeringer Efter translationen sker der forskellige former for kemiske ændringer af polypeptidet, såkaldte posttranslationelle modificeringer, som er nødvendige for at opnå det modne slutprodukt, fx et aktivt enzym. Ud over fraspaltning af den N- terminale methionin kan der være tale om fraspaltning af et længere N-terminalt peptid, idet en række proteiner syntetiseres som længere forstadier til det endelige funktionelle protein, fx med en N-terminal sekvens der har den funktion at få proteinet importeret til mitokondrierne eller eksporteret fra cellen. Andre vigtige posttranslationelle modificeringer kan bestå i tilhæftning af fx kulhydratgrupper (glykosylering) eller fosfatgrupper (fosforylering) eller i oxidering af aminosyrer, fx lysin og prolin i collagen til hhv. hydroxylysin og hydroxyprolin, eller to cysteiner under dannelse af en disulfidbro. I tilfælde af at der pga. codon- eller splejsningsmutation syntetiseres et protein med en forkert aminosyresekvens, vil proteinmolekylet evt. være ustabilt, fx fordi det ikke kan danne den normale stabile rumlige struktur, og hurtigt blive nedbrudt via et af cellens kvalitetskontrolsystemer, se ubikvitinylering Fig. 13.1, s Ikkekodende RNA Man har længe kendt til gener i det nukleære genom hvis slutprodukter er funktionelle ikkeproteinkodende RNA-molekyler (såkaldt ikkekodende RNA, ncrna; eng. non-coding RNA). Fx rrna og trna der har centrale funktioner i protein-syntesen (Fig. 1.10), samt snrna og snorna der indgår i modningen af primære transkripter, hhv. præ-mrna og præ-rrna (Tabel 1.4). Inden for de seneste 10 år har man karakteriseret nye former for ncrna som er vigtige aktører i reguleringen af genekspression. Det har vist sig at 90 % eller mere af det humane genom transkriberes, og at de nyopdagede transkripter omfatter tusindvis af ikkekodende RNA er. Nogle er lange, dvs. >200 nt, og betegnes lncrna (udtales link-rna ; eng. long non-coding RNA), andre er ganske korte (20-30 nt; mirna og pirna), se de følgende afsnit. Mens skønnet over antallet af proteinkodende gener stagnerer eller ligefrem falder, bliver der nu fundet flere og flere ncrnagener. Disse har forskellige størrelser og mange forskellige funktioner (Tabel 1.4). Mikro-RNA Mikro-RNA (mirna, mir) er samlebetegnelse for korte ncrna-molekyler på nt som er involveret i regulering af genekspression på det posttranskriptionelle niveau. Det er små interfererende RNA-molekyler (sirna, eng. small interfering RNA) der virker ved at en sekvens på 6-8 baser (kaldet seed-sekvensen, eng. seed, frø, kim) i molekylets 5 -ende baseparrer med komplementære sekvenser i mrna s 3 UTR. Et givet mikro-rna kan have flere mrnamål, og resultatet af dannelsen af mirna/ mrna-komplekserne er typisk det at translationen af det pågældende mrna standser, evt. at mrna et nedbrydes. På den måde kan mange geners ekspression reguleres på en gang. Man har påvist ca. 900 mikro-rna-gener i det haploide genom, men forskningsfeltet er i rivende udvikling, og det skønnes at der er mindst Mange af generne transkriberes af RNA-polymerase II, ligesom de proteinkodende gener, hvorfor det primære transkript (primirna) undergår både capping og polyadenylering; andre transkriberes af RNA-polymerase III, den samme RNA-polymerase som transkriberer trna- og 5S rrna-generne. Ved udtalt intern baseparring danner et primirna en dobbeltstrenget struktur med loop (hårnålestruktur) der i cellekernen processeres til et kort dobbeltstrenget mirna-forstadium, præ-mirna, som eksporteres til cytoplasmaet book.indb 36 09/12/

33 IKKEKODENDE RNA Nogle præ-mirna er dannes ud fra introns (såkaldte mirtrons) udsplejset fra præ-mrna er. I cytosolen kløves præ-mirna er enzymatisk 6 til korte dobbeltstrengede RNA-molekyler, hvorfra den ene streng sædvanligvis nedbrydes og den anden frigøres som mikro-rna. Sammen med nogle bestemte proteiner danner mikro-rna erne de ribonukleoprotein-komplekser, kaldet miriss (micro RNA-induced silencing complexes, se Fig s. 321), som formidler mikro-rna s binding til præ-mrna. De pågældende proteiner medvirker til at modulere mikro-rna ets virkning. Et af de proteiner der indgår i komplekserne, er FMR1, det protein der kodes af genet FMR1 (se fragilt X- syndrom, s. 310). De regulatoriske funktioner er af overordnet karakter, og mikro-rna er ser ud til at være centrale molekyler i regulering af bl.a. differentiering og organudvikling. Andre korte funktionelle ncrna er En stor gruppe RNA er på nt optræder øjensynligt kun i gonaderne hvor de forekommer i op til 1 mio. molekyler pr. celle i spermatocytter og spermatider. De betegnes pirna (piwi-interacting RNA 7 ), og der er påvist ca forskellige slags hos mennesket. Størstedelen af dem har en basesekvens der er komplementær til sekvensen i transkripter af transposoner (s. 39), og det formodes derfor at de har en vigtig funktion ved at hæmme ekspressionen af transposoner i kimbanen og dermed forhindre at der sker mutationer ved insertionen af transposoner i gener på nye steder i genomet. 6 Enzymet kaldes Dicer (eng. to dice, skære i småstykker). 7 Piwi er betegnelsen for den gruppe proteiner som disse RNA er virker i kompleks med. De er først påvist hos bananfluer hvorfra de har deres navn, en forkortelse af P- element induced wimpy testis. Lange ikkekodende RNA er Man skønner at > 80% af den samlede transkription i en celle har med lange ikkekodende RNA-molekyler at gøre (long non-coding RNA, lncrna link-rna ). De pågældende geners struktur ligner overordnet de proteinkodende geners, og de er ofte mange tusind basepar lange. Man har til dato påvist flere end forskellige lncrna er, hvoraf mange udtrykkes vævs- og udviklingsspecifikt. En række af dem er involveret i regulering af genekspression via epigenetiske modifikationer som fx metylering af pg-sekvenser samt metylering og acetylering af histoner (se s. 45). Et eksempel er XIST-RNA (eng. X-inactivation specific transcript, X-inaktiveringsspecifikt transkript) der styrer X-kromosom-inaktiveringen (s. 46 og s. 119). Mange lncrna er er involveret i imprintning af gener, dvs. det forhold at kun enten den paternelle eller den maternelle allel af et gen udtrykkes (se afsnittet om epigenetiske modifikationer s. 46). lncrna er kan også modulere transkription og proteinnedbrydning, ligesom nogle er involveret i biosyntesen af organeller og den subcellulære trafik. Repetitivt DNA Over halvdelen af genomet udgøres af gentagne DNA-sekvenser (repetitivt DNA) som enten kan være moderat eller kraftigt repeterede. De inddeles i tre overordnede grupper: 1) interspersed repeats (Tabel 1.5), hvor de individuelle repeterede enheder er fordelt over hele genomet på en tilsyneladende tilfældig måde, 2) tandem-repeteret DNA (Tabel 1.6), hvor de repeterede enheder ligger i forlængelse af hinanden i blokke af forskellige længder, og 3) segmentale duplikationer book.indb 37 09/12/

34 KAPITEL 1 MENNESKETS GENOM Tabel 1.4 Forskellige typer ikkekodende RNA (ncrna) og deres funktion RNA-type størrelse (nt) Ribosomalt RNA (rrna) nt Transfer RNA (trna) nt Små nukleære RNA er (snrna) nt Undergrupper Mitokondrielle, 12S rrna og 16S rrna ytosoliske 5S RNA, 5,8S RNA, 18S RNA, 28S RNA Antal typer Funktion Genorganisation 1 af hver Del af mitokondrielle ribosomer To nabogener i mtdna (Fig. 1.17) 1 af hver Del af cytosoliske ribosomer rdna-klynger på de akrocentriske kromosomers korte arme Mitokondrielle 22 Aflæser mitokondrielt mrna Enkeltkopi-gener. ytosoliske 49 Aflæser cytosolisk mrna 700 trna-gener og -pseudogener fordelt over genomet Splejsosom-familie: U1,U2,U4, U5, U6, U11, U12 9 Udsplejsning af introns fra præ-mrna Omkring 200 snrnagener fordelt over genomet Små nukleolære RNA er (snorna) nt Små ajal-legeme-rna er (scarna) Ikke splejsosomassocieret: U7 /D-klassen (bestemte sekvenser fælles) H/AA-klassen (bestemte sekvenser fælles) mange Modning af histon-præ-mrna Enkeltkopi-gener 246 Modning af rrna ved metylering U3: Kløvning af præ-rrna 94 Modning af rrna ved isomerisering af uridiner i præ-rna Beliggende i introns af proteinkodende gener U3: 5-6 kopier på 17p. Selvstændig promotor Beliggende i introns af proteinkodende gener 25 Modning af visse snrna er Beliggende i introns af proteinkodende gener RNA-ribonukleaser 2 Modner trna i kernen og i mitokondrierne Mikro-RNA (mirna) 22 nt Piwi-associeret RNA (pirna) nt Endogen short interfering RNA (endo-sirna) nt Lange ikkekodende RNA er (lncrna) Ofte >1kb Forskellige små cytoplasmatiske RNA er (sncrna) nt >70 familier af beslægtede mirna er 89 individuelle grupper 1000 Mange regulatoriske funktioner i celledifferentiering og vævsudvikling > Kun udtrykt i kønsceller, hvor de bremser transposon-aktivitet Mange?> Involveret i gen-regulation i somatiske celler Mange >3.000 Involveret i gen-regulation og mono-allel ekspression (Xinaktivering, imprintning) TER 1 Telomerase-komponent til telomer-syntese B200 1 Neuralt RNA, regulerer syntesen af dendritproteiner Enkeltkopi-gener Fordelt i genomet, nogle i klynger 89 genklynger fordelt i genomet Mange genklynger fordelt i genomet Enkeltkopi-gener, Enkeltkopi-gen på 3q26 Enkeltkopi-gen på 2p book.indb 38 09/12/

35 IKKEKODENDE RNA Tabel 1.5 De forskellige typer af interspersed repeat-dna i menneskets genom Type af repeat Undertype Størrelse på repeat-enhed Antal kopier % af genomet SINEs: Short Interspersed Nuclear Elements LINEs: Long Interspersed Nuclear Elements LTR-elementer: Long Terminal Repeats Andre DNAtransposoner Alu MIR-familier LINE-1 (Kpn) LINE-2 LINE-3 ERV klasse I ERV(K) klasse II ERV(L) klasse III MaLR hat Tc-1 PiggyBack Uklassificeret Fuld længde 0,3 kb Middelstørrelse 0,13 kb Fuld længde 6,1 kb Middelstørrelse 0,8 kb Middelstørrelse 0,25 kb - Middelstørrelse 1,3 kb - Middelstørrelse 0,5 kb Varierende, men middelstørrelse måske 0,25 kb Middelstørrelse måske 0,4 kb ,1 0,2-0,2-4 2,5 0,8 Interspersed repeats Størstedelen af det repetitive DNA er interspersed repeat DNA, dvs. gentagne DNA-segmenter spredt i genomet (Tabel 1.5). Det er segmenter som er deriveret fra såkaldte transposoner, dvs. DNA-segmenter der udviser mobilitet inden for genomet. Der findes 4 typer af transposoner: SINEs (short interspersed nuclear elements), LINEs (long interspersed nuclear elements), LTR-elementer (long terminal repeats) og andre DNA-transposoner. LINEs, SINEs og LTR-elementer er såkaldte retrotransposoner. Deres mobilitet beror på at der i cellen laves DNA-kopier af transkripterne (vha. enzymet revers transkriptase) med efterfølgende indsætning af kopierne et andet sted i genomet. Andre DNA-transposoner kan migrere direkte ved at de skæres ud fra deres lokalitet og sættes ind igen et andet sted i genomet (se også afsnittet Insertion ved transposition, s. 76). Transposoner er meget udbredte i geno met og hyppige i proteinkodende geners UTR er. De kan have regulerende funktioner i genomet ved bl.a. at udgøre alternative promotorer i forskellige gener. Blandt de forskellige transposoner er de ca. 300 bp lange primatspecifikke Alu-elementer blandt de hyppigst forekommende med omkring 1,1 million kopier (forstavelsen Alu hentyder til at disse elementer oprindeligt blev karakteriseret ved at de kunne kløves af restriktionsenzymet AluI). De udgør i alt ca. 10 % af genomet. Alu-elementer kan have patogen betydning på forskellige måder. Et eksempel på et meget Alurigt gen er BRA1 som er involveret i arvelig disposition for mamma- og ovariecancer (HBO, se s. 242). Genet har en udstrækning på ca. 80 kb, og omkring 40 % heraf udgøres af Aluelementer. Man har påvist at BRA1-mRNA forekommer i to former den ene har en kort 5 UTR og udtrykkes i normalt brystkirtelvæv. Den anden form har en længere 5 UTR, som følge af insertion af et Alu-element i genet. Den længere form udtrykkes i mammacancervæv ved den sporadiske form for brystkræft. Når 5 UTRregionen er blevet forlænget som følge af Alu book.indb 39 09/12/

36 KAPITEL 1 MENNESKETS GENOM element-insertion, bliver effektiviteten af BRA1-mRNA ets translation reduceret med 90 %. Ved den arvelige form for mammacancer har man fundet mutationer i BRA1-genet som medfører nedsat funktion af BRA1-proteinet. Den patofysiologiske mekanisme i de to situationer er således formentlig den samme, nemlig nedsat funktion af BRA1-proteinet, men den genetiske årsag er forskellig. Den hyppige forekomst af repeterede elementer disponerer for opståen af deletioner og duplikationer pga. skæv overkrydsning (Fig. 3.9). Det forklarer bl.a. forekomsten af tilfælde af familiær hyperkolesterolæmi der skyldes deletions- og duplikationsmutationer i genet for LDL-receptoren hvor der forekommer flere Alu-elementer. Af andre sygdomme, hvor man har fundet at transposoner er involveret i patogene mutationer, fx inaktiverende insertion af et LINE-element i en exon, kan nævnes hæmofilierne A og B og coloncancer (AP-genet). Tandemrepeteret DNA Der findes flere familier af tandem repeats som alle er opbygget af blokke (arrays) af tandemrepeterede enheder (Tabel 1.6). Den repeterede enhed varierer i størrelse fra et enkelt op til knap 200 basepar. De enkelte blokke kan forekomme på få eller mange kromosomale lokalisationer og kan have betydning i forbindelse med eksempelvis den rekombination der foregår under meiosen, samt for dannelsen af duplikationer og deletioner (Fig. 3.8 og 3.9). Ud fra størrelsen af den repeterede enhed kan det stærkt repeterede ikkekodende DNA inddeles i tre hovedgrupper: 1) satellit-dna, 2) minisatellit-dna, og 3) mikrosatellit-dna. Der er flere familier af satellit-dna (α-, β-, satellit 1 etc., Tabel 1.6) som alle hovedsageligt findes i centromerer og heterokromatiske kromosomregioner og består af blokke som samlet kan blive op imod 1-5 Mb lange. Den repeterede enhed (repeatet) er fra 5 til 171 bp lang og repeteret flere tusinde gange. Minisatellit-DNA består af mindre blokke, hvor størrelsen af repeat-enheden er på 6-64 bp. Dette resulterer i samlede repeat-blokke på typisk mellem 100 bp og 20 kb. Der findes minisatellit- DNA i kromosomernes telomerer og som hy- Tabel 1.6 Gruppe Tandemrepeteret DNA Satellit-DNA (blokke på fra 100 kb til mange Mb) α-satellit-dna (alphoid DNA) β-satellit-dna (Sau3A-familie) Satellit 1 (AT-rigt) Satellit 2 og 3 Minisatellit-DNA (blokke på 0,1-20 kb) Telomer-familie Hypervariabel familie og telomer-associerede repeats Mikrosatellit-DNA (blokke ofte på mindre end 150 bp) Størrelse på repeatenhed bp 171 bp 68 bp bp 5 bp 6-64 bp 6 bp 9-64 bp 1-4 bp Kromosomal lokalisation Især ved centromererne entromert heterokromatin på alle kromosomer entromert heterokromatin på 1,9,13,14,15,21,22 og Y entromert heterokromatin på de fleste kromosomer De fleste, måske alle, kromosomer Ved eller tæt på telomerer af alle kromosomer Alle telomerer Alle kromosomer, ofte tæt på telomerer Spredt rundt på alle kromosomer book.indb 40 09/12/

37 IKKEKODENDE RNA pervariable minisatelliter rundt omkring i genomet, ofte nær telomererne. De første højvariable DNA-markører man anvendte i rets genetiske undersøgelser (DNA-profilanalyser), var minisatellitter som udgjorde restriktionsfragmentlængdepolymorfier, RFLP er (se afsnittet Genetiske markører og markøranalyse, s. 77). Mikrosatellit-DNA består af korte blokke hvor den repeterede enhed oftest er 1-6 bp i længden. Det er karakteristisk for mikrosatellitterne at antallet af repeterede enheder kan ændres i forbindelse med skred under DNA-replikationen (replication slippage, Fig. 3.7) eller som følge af en skæv overkrydsning (Fig. 3.8). En medicinsk særlig vigtig type af mikrosatellitter er dem med en repeteret enhed på 3 bp, de såkaldte trinukleotidrepeats, se afsnittene Repeatsygdomme (s. 287). Den store variation i længden af mange miniog mikrosatellitblokke gør dem til vigtige genetiske markører (se Boks 3.2). Mindre DNA-sekvensvariationer Gruppen inddeles i tre forskellige typer: 1. Mikrosatellitter (short tandem repeat polymorphisms, STRPs) 2. Insertion-deletion-polymorfier (indels) 3. Enkeltnukleotid-polymorfier (single nucleotide polymorphisms, SNPs, snips, SNP er) Mikrosatellitter er VNTR er (variable number of tandem repeats) med enheder (repeats) på 1-6 bp. De udgør ca. 3 % af det humane genom, og der findes én mikrosatellit for ca. hver 2 kb. Længdevariationer skyldes variationer i antallet af repeats som følge af enten skæv overkrydsning eller replication slippage. Dinukleotidrepeats, (A) n og (TA) n, er de vigtigste, både hvad angår hyppighed og anvendelse som genetiske markører. De mindre hyppige er tri- og tetranukleotidrepeats, og de er også mindre udsatte for replication slippage. Trinukleotidrepeats er, som nævnt, medicinsk vigtige i forbindelse med de såkaldte trinukleotidrepeatsygdomme, mens mikrosatellitter med tetranukleotidrepeats har fundet stor praktisk anvendelse som markører inden for retsgenetikken (DNA-profilanalyse) og ved koblingsanalayse (s. 135 og Fig. 5.3A). Indels: Insertion-deletion-polymorfier kan være af forskellig størrelse, typisk bp, og opstår som oftest som følge af insertion eller deletion af en transposon. I skrivende stund har man identificeret over indels. De findes spredt i genomet, i geners introns og exons samt i deres promotorregioner. Dette betyder at de kan påvirke genekspressionen samt proteiners struktur og/eller funktion. Enkeltnukleotid-polymorfier (SNP er, snips ), er, som navnet siger, DNA-sekvensvariationer der omfatter et enkelt basepar, hvor der kan være substitution, insertion eller deletion. Man har nu identificeret mere end 10 millioner SNP er fordelt over genomet, og de er blevet katalogiseret i en offentligt tilgængelig SNPdatabase. For år tilbage etableredes et internationalt konsortium med det formål at kortlægge enkeltnukleotid-variationer i forskellige befolkningsgrupper, til brug for bl.a. undersøgelser over deres evt. association med fænotypiske, herunder sygdomsrelaterede, forandringer. Man har i projektet bl.a. typet over 1 mio. SNP er i DNA-prøver fra individer i Afrika, USA, Kina og Japan. Analyserne viste at der i hovedparten af nukleotidpositionerne generelt set ikke er stor variation, men at der i ca. 1 ud 300 bp forekommer hyppige variationer. Disse variationer skyldes ikke nymutationer, men er opstået i løbet af menneskets evolution. I store populationsbaserede studier genomdækkende associationsstudier (genomewide association studies, GWAS, s. 134) har man brugt dem som markører til påvisning af en evt. genetisk kompo book.indb 41 09/12/

38 KAPITEL 1 MENNESKETS GENOM nent i udbredte sygdomme som diabetes mellitus, astma, rohns sygdom og cancer (se Kap. 6). Strukturelle genomiske variationer Indtil for nogle få år siden antog man generelt at variationerne i det humane genom lå i størrelsesordenen bp, og at der ikke normalt forekom større strukturelle variationer. Pga. den hastige udvikling i micro array-teknologierne gennem de seneste 5 år (s. 344), hvor det er blevet muligt at undersøge hele genomer i én arbejdsgang med næsten ubegrænset opløsning, har man imidlertid opdaget en ny type af variation kaldet strukturelle variationer. Termen strukturelle genomiske variationer refererer til en ny klasse af forandringer i det nukleære genomiske DNA som er større end basepar. Det kan være ubalancerede kopitalsvariationer (copy number variations, NV er) i form af deletioner og duplikationer eller mindre hyppige balancerede neutrale variationer (genomiske inversioner, reciprokke translokationer). Ubalancerede strukturelle genetiske variationer har været kendt i mange år, men man har troet at de var begrænset til sjældne genetiske syndromer såsom Williams syndrom (deletion i båndregion 7q11.23) og harcot-marie-tooths neuropati type IA (duplikation i båndregionen 17p11.2, s. 287). Det kom derfor som en stor overraskelse da undersøgelser med anvendelse af micro array-teknologi viste at der hos raske individer kan forekomme ubalancerede variationer som omfatter store DNAsegmenter på kb, uden nogen tilsyneladende association med sygdom. Der er databaser som katalogiserer disse strukturelle variationer, eksempelvis databaserne DEIP- HER og EARUA, 8 og til dato (2010) er der påvist ca steder i genomet hvor der er beskrevet knap kopitalsvariationer som berører mere end gener. Balancerede neutrale variationer, som inversioner og translokationer, er ikke fundet med samme hyppighed. Det skyldes at de ikke kan detekteres med de effektive high throughput microarray teknologier, men kræver sekventeringsbaserede metoder som er mere kostbare og tidskrævende, hvorfor man endnu ikke har fået undersøgt så mange individer. Man har endnu ikke fået kortlagt alle de NV er der kan forekomme eller deres hyppigheder i befolkningerne, ligesom man heller ikke ved om de reelt kan betegnes som normale kopitalsforandringer. Disse forhold gør det vanskeligt at fortolke micro array-resultater når der påvises NV er som ikke er kendt som patogene forandringer. Segmentale duplikationer Op til 5 % af det humane haploide genom består af lange DNA-segmenter på kb som findes i to eller flere næsten identiske kopier og øjensynligt blev en del af vores genom for millioner år siden. Duplikationer med > 90 % DNA-sekvensidentitet forekommer især pericentromert og i de subtelomere regioner. Sådanne duplikationer er ofte ca. 1 kb store. De benævnes low copy repeats (LR) og kan forekomme på samme eller hvert sit kromosom. Når de sidder på samme kromosom, kan de være orienteret i samme eller i modsat retning og i større eller mindre afstand fra hinanden, hvilket har betydning for om bestemte genomiske forandringer er rekurrente (tilbagevendende) eller ej. 22q11-deletionssyndrom (DiGeorges sekvens, Boks 4.8) er et eksempel 8 European ytogeneticists Association Register of Unbalanced hromosome Aberrations book.indb 42 09/12/

39 DNA ETS ORGANISERING I ELLEKERNEN KROMATIN OG KROMOSOMER på en rekurrent genomisk forandring der i > 80 % af tilfældene skyldes en bestemt deletion på grund af et bestemt LR. I tilfælde hvor størrelsen af et LR er > 10 kb med omkring 97 % sekvensidentitiet, har det vist sig at medføre genomisk instabilitet som resulterer i deletioner, insertioner og translokationer. DNA ets organisering i cellekernen kromatin og kromosomer Den samlede længde af de 46 DNA-molekyler i en cellekerne i cellecyklens G 1 -fase (s. 55) er knap 2 meter. De er pakket i en cellekerne som for en typisk menneskecelle vil være omkring 5-8 µm i diameter. Omregnet svarer det til at en tennisbold indeholder en ca. 20 km lang meget tynd tråd (ca. 20 µm i tykkelse). Når cellekernen kan rumme de ca. 2 meter DNA, skyldes det at DNA et er pakket med forskellige proteiner i det tidligere nævnte nukleoproteinkompleks, kromatin (Boks 1.8). Disse proteiner omfatter dels en familie af basiske proteiner kaldet histoner, dels en heterogen gruppe af sure, såkaldte non-histon-proteiner, som er knap så velkarakteriserede som histonerne. De forskellige hierarkiske niveauer i pakningen af kromosomer er skematiseret i Figur Der er fem hovedtyper af histoner (H1, H2A, H2B, H3 og H4) som spiller en særdeles vigtig rolle for pakningen af DNA et, og som har væsentlig betydning for bl.a. genekspressionen. To kopier af hver af de fire histoner H2A, H2B, H3 og H4 danner tilsammen en histon-oktamér. Et ca. 140 bp langt segment af DNA-dobbelthelix- Kromatider 600 nm p q ,5 Mb 6,0 Mb 7,0 Mb 4,5 Mb 5,5 Mb 3,0 Mb 8,5 Mb 8,0 Mb 4,5 Mb 7,5 Mb 8,0 Mb 1,5 Mb 2 nm 600 nm 600 nm Linker Nukleosom DNAdobbelthelix Kromatinloop (~75 kb) Scaffold 30 nm 10 nm 30 nm 10 nm Kromatinfiber Figur Pakning af DNA i cellekernen; fra dobbelthelix til metafasekromosom. Tegningen viser et idiogram af kromosom 17 i G-båndfarvning (400-bånds opløsning). Til venstre for kromosomet er anført båndnummereringen, og til højre for de omtrentlige længder af DNA-segmenterne i de enkelte lyse og mørke bånd. Til højre for idiogrammet er vist en stiliseret tegning af DNA et i kromosomets to kromatider, til illustration af at hvert kromatid indeholder en enkelt DNAdobbelthelix. I kromatiderne er DNA-dobbelthelixerne pakket som illustreret i tegningens nederste del. Den omtrentlige pakkeratio (længdeforholdet mellem pakket og upakket DNA) er 1:10 for 10 nm-fiberen, 1:36 for 30 nm-fiberen og 1: > for metafasekromosomet book.indb 43 09/12/

40 KAPITEL 1 MENNESKETS GENOM en vindes knap to omgange omkring en sådan histon-oktamér, ligesom en tråd om en spole. Det enkelte kompleks af histon-oktamér og DNA-segment kaldes et nukleosom og er den grundlæggende strukturelle enhed i kromatinet. Betydningen af disse fire histoner afspejles i det forhold at deres aminosyresekvenser er meget velbevarede gennem evolutionen. Histon H1, hvis aminosyresekvens varierer en del mere mellem arterne end de øvrige histoners, binder mere eller mindre kraftigt til DNA et på siden af hvert nukleosom, hvilket har betydning for om kromatinet er hhv. lukket (kompakt) eller åbent (løst) (Boks 1.8). Dette pakningsniveau bestemmes af kemiske modifikationer af DNA og histoner. På grund af en mindre kraftig H1-binding, og en udbredt acetylering af histon-oktamérerne, er det meste kromatin i interfasen organiseret i en åben form (eukromatin). Dette kan dog variere betydeligt fra celletype til celletype og har betydning for om DNA et er tilgængeligt. Andet kromatin findes i en lukket form (heterokromatin). Det forbliver uændret gennem cellecyklus pga. kraftig H1-binding. De enkelte nukleosomfibre (10 nm-fiberen, Fig. 1.16) pakkes yderligere så der dannes en 30 nm-kromatinfiber der foldes i form af såkaldte loops (slynger) eller domæner som med intervaller på omkring kb er fastgjort til et nonhiston-protein-netværk kaldet scaffold (proteinskelet). De enkelte loops er bundet til proteinskelettet via AT-rige DNA-regioner kaldet SARs (scaffold attachment regions). Denne looping er også med til at bringe DNA-sekvenser som sidder langt fra hinanden målt på den lineære sekvens tæt sammen, så de og deres bundne proteiner kan interagere (jf. afsnittet Transkription og posttranskriptionel modificering, s. 28, samt Fig. 1.12). Boks 1.8 Eukromatin og heterokromatin Ved kromatin forstår man det kompleks af DNA og proteiner som udgør kromosomerne. Termen er oprindeligt indført af cytologer i slutningen af 1800-tallet for den farvbare substans i kromosomerne (kromosom = farvbart legeme; gr. kromos, farve, og soma, legeme). Det var den samme substans Miescher i sine kemiske undersøgelser gav navnet Nuklein (Boks 1.1). Man skelner mellem to former af kromatin: en kompakt stærkt farvbar form, heterokromatin, og en mindre kompakt og mindre stærkt farvbar form, eukromatin. HETEROKROMATIN 1 Konstitutivt heterokromatin indeholder repeteret DNA uden proteinkodende gener. Det bevares kompakt i sin organisation igennem cellecyklus. Konstitutivt heterokromatin omfatter bl.a. kromatinet i centromerer og telomerer samt i hovedparten af Y-kromosomet. 2 Fakultativt heterokromatin er sommetider inaktivt, lukket, til andre tider aktivt, åbent. Man mener at det indeholder gener som er inaktive i nogle typer celler eller i bestemte dele af cellecyklus, mens de i andre celler eller andre dele af cellecyklus er aktive. Når generne er inaktive, pakkes kromatinet som heterokromatin. Det menes at kromatinstrukturen er så kompakt at de proteiner som er involveret i genekspression, ikke kan få adgang til DNA et. Det inaktive X-kromosom hos kvinder i somatiske celler er et eksempel. EUKROMATIN De resterende kromosomregioner som indeholder de aktive gener, er mindre kompakte og tillader at ekspressions-proteinerne får adgang til DNA et. Eukromatin udgør over 90 % af kromatinet og findes spredt i kromosomerne book.indb 44 09/12/

41 DNA ETS ORGANISERING I ELLEKERNEN KROMATIN OG KROMOSOMER Epigenetisk variation, kromatinkonformationens betydning for genekspression Med afslutningen af det humane genomprojekt har vi fået en omfattende viden om det genetiske materiale der skal til for at danne et individ og vedligeholde dets celler og organsystemer. Forståelsen af hvordan den biologiske information anvendes, kræver dog langt mere end et simpelt katalog over gener, selvom dette i sig selv er en væsentlig information. Forståelse af dé biologiske forhold som er afgørende for hvilke af de mange gener der skal være aktive i hvilke celler og på hvilket tidspunkt, samt hvilke dele af de enkelte gener som skal udtrykkes i de enkelte celler, er mindst lige så vigtig som selve det humane genoms sekvensinformation. Man har allerede påvist vigtige faktorer i disse systemer, såkaldt epigenetisk variation (variation der ikke vedrører genomets basesekvens), der har betydning for den differentierede anvendelse af cellernes genetiske information. De epigenetiske forhold varierer fra celletype til celletype og har yderligere den vigtige egenskab at de kan videregives ved den somatiske celledeling. Under kønscelledannelsen sker der derimod det at de fleste parentale epigenetiske modifikationer falder bort. Epigenetiske faktorer ændrer pr. definition ikke basesekvensen i DNA et, men modificerer i stedet kromatinet, hvilket inkluderer DNA-metylering og posttranslationelle modifikationer af de histoner der pakker DNA et i nukleosomer. I modsætning til genomet, som i det væsentligste er uforandret i de fleste celler hos mennesket, er epigenomet produktet af en kontinuerlig forandring i cellerne under deres differentiering. Dette medfører et stadig mere begrænset mønster i hvilke gener der udtrykkes, og som kan modificeres af miljøfaktorer. En celles epigenom kan defineres som kombinationen af alle de kromatinmodifikationer der forekommer i den givne celletype, og som bestemmer dens unikke genudtryk. Epigenomer er foranderlige gennem fx vævs og organers udvikling, påvirkelige af miljøfaktorer, ændret ved visse sygdomme og kan være forskellige selv hos individer med samme genotype (bl.a. enæggede tvillinger). I Tabel 1.7 er der givet en oversigt over de epigenetiske modifikationer histon-modifikationer og DNAmetylering som har betydning for aktive og mindre aktive gener. Noget tyder på at processerne for DNA-metylering og histon-acetylering er koblede, men den nærmere biologiske betydning heraf er endnu ikke klarlagt. Histonmodifikationer betydning for kromatinkonformation og genekspression Det er en nødvendig, men ikke tilstrækkelig, betingelse for at der kan ske genekspression at kromatinet findes i form af eukromatin. Det er bestemte modifikationer af histonerne som bestemmer kromatinets konformation. Histonerne kan modificeres ved acetylering, metylering (mono, di og tri) samt fosforylering. Det er en kombination af disse som bestemmer om kromatinet bestemte steder i genomet er i en åben eller i en lukket form, men generelt set har eukromatin (aktive gener, Tabel 1.7) hyperacetylerede histoner, mens heterokromatin er hypoacetyleret. Der findes store familier af enzymer som er ansvarlige for histon-modifikationerne. Tabel 1.7 Epigenetiske modifikationer ved aktive og inaktive gener Epigenetisk modifikation Aktive gener Inaktive gener DNA-metylering Hypometylering af promotor-regionen Hypermetylering af promotor-regionen Histon-acetylering Acetylerede histoner De-acetylerede histoner book.indb 45 09/12/

42 KAPITEL 1 MENNESKETS GENOM Genernes ekspression eller aktivitet bestemmes af den måde hvorpå nukleosomerne er pakket i højereordens strukturer, dvs. den overordnede kromatinkonformation. Der findes to basale varianter: heterokromatin som er en lukket inaktiv konformation, og eukromatin som er en åben potentielt aktiv konformation (Boks 1.8). Heterokromatin kan være konstitutivt, hvilket betyder at det bevarer den lukkede struktur under hele cellecyklus. Dets DNA består især af segmenter af repeterede DNA-sekvenser med kun få gener imellem. Heterokromatin kan også være fakultativt, hvilket betyder at den lukkede konformation er reversibel som det for eksempel kan ses ved det inaktive X- kromosom fra den ene generation til den næste. DNA-metylerings betydning for genekspressionen DNA-metylering er den bedst beskrevne epigenetiske mekanisme til regulation af genekspressionen. Hos mennesket er der næsten udelukkenede tale om metylering af cytosin i 5-positionen i cytosin-guanin-sekvenser (pg, s. 67). Der findes omkring steder i genomet hvor der i et DNA-segment på 1-2 kb er en ophobning af pg-dinukleotider, såkaldte pg-øer. De forekommer ofte i husholdningsgenernes promotorregioner (s. 28) hvor de typisk er umetylerede i alle celletyper. Generelt kan det siges at ekspressionen af gener korrelerer omvendt med hvor mange metylerede cytosinbaser der er i og omkring de regulatoriske områder af genet. Aktive gener har få eller ingen metylerede cytosiner (hypometylering) i deres promotorregion, mens inaktive gener har mange metylerede cytosin-baser i og omkring promotorregionen (hypermetylering). I normale celler foregår DNA-metylering især i dé genomiske områder som har repeterede sekvenser såsom satellit-dna, SINEs og LINEs samt ved geners promotorregion og deres exon 1. Der findes også spredte pg-sekvenser i exons og introns samt mellem gener. Man har fundet at ca. 70 % af pg-dinukleotiderne i genomet er metyleret. Der findes også gener som ikke har pg-øer, bl.a. generne for væksthormon og insulin. Epigenetiske modifikationer, herunder X-kromosom-inaktivering og genomisk imprintning Epigenetiske modifikationer medfører ændringer i genernes ekspression, men involverer, som anført, ikke forandringer i selve DNA-sekvensen, ud over metylering af cytosiner. De epigenetiske forandringer kan i cellen eksistere over forskellig tid. X-kromosom-inaktivering og imprintning er eksempler på epigenetiske modifikationer der bevares gennem de somatiske celledelinger, men ophæves i meiosen. For imprintnings vedkommende undergår genomet på ny en kønsspecifik imprintning under meioseforløbet. Der er dog enkelte eksempler på epigenetiske effekter som kan nedarves og som da kaldes paramutationer. X-kromosom-inaktivering og imprintning resulterer i mono-allel genekspression, dvs. at kun den ene allel på et givet locus er aktiv. Disse epigenetiske forandringer afhænger af DNA-metylering. Der findes tre DNA-metyltransferaser (DNMT1, DNMT3A og DNMT3B) som kan metylere pg-sekvenser. DNMT1 kan kun metylere hemimetylerede pg-sekvenser (dvs. pg hvis komplementære sekvens i DNA ets modsatte streng er metyleret) der optræder efter DNAreplikationen i mitosen, og enzymet er dermed med til at vedligeholde en fuldt metyleret DNAsekvens. DNMT3A og DNMT3B metylerer umetylerede pg-sekvenser som optræder i meiosen, og disse enzymer kan dermed de novo etablere metylering, fx i form af imprintning. Tidligt i den hunlige embryogenese sker der i somatiske celler normalt en tilfældig, men permanent inaktivering af det ene X-kromosom som følge af hypermetylering. Det er et eksem book.indb 46 09/12/

43 MITOKONDRIE-DNA (MTDNA) pel på en epigenetisk forandring der bevares gennem mitoserne, men ikke fra mor til barn. Dette betyder at ca. halvdelen af de somatiske celler hos kvinder har det paternelt nedarvede X-kromosom aktivt, mens de øvrige celler har det maternelle X-kromosom aktivt (se nærmere om X-kromosom-inaktivering i Kap. 5, s. 119ff.). I embryoner med kvindelig kønskromosombesætning er begge X-kromosomer aktive op til cellestadiet, hvorefter enten det maternelle eller det paternelle X-kromosom inaktiveres i de enkelte celler i den cellehob der udvikles til fosteret. Inaktiveringen af X-kromosomet initieres ved XI (X-inativeringscenteret) der sidder på Xq13, og bredes derefter ud over næsten hele kromosomet. XI transkriberes til et stort ikkekodende RNA, lncrna et XIST, som kun bliver udtrykt fra det X-kromosom der inaktiveres. Det primære XIST-RNA splejses og polyadenyleres til et 17 kb stort modent XIST-RNA der rekrutterer proteiner som organiserer kromatinet til en inaktiv lukket konformation. Det er dog ikke hele X-kromosomet der inaktiveres idet bl.a. de pseudoautosomale regioner og visse andre mindre regioner undslipper. XIST er kun nødvendig for initieringen af X-kromosom-inaktiveringen, ikke for vedligeholdelsen heraf. Ved imprintning afhænger genekspressionen i de pågældende loci af den parentale oprindelse. Hos mennesket er der påvist imprintede gener i følgende kromosomregioner: 6q24-q26, 7q21- q22, 7q32, 7p12, 8q24, 11p15, 14q32, 15q11-q13, 19q13 og 20q13. Man har ligeledes fundet at den mono-allelle ekspression er knyttet til bestemte væv og bestemte stadier i individets udvikling. For visse geners vedkommende er det vigtigt om det er den maternelle eller den paternelle allel der udtrykkes, mens det for andre geners vedkommende er ligegyldigt, så længe det kun er den ene allel der udtrykkes. For eksempel inaktiveres den paternelle UBE3A-allel i hjernevæv, mens genet udtrykkes bi-allelt i alle andre væv. For andre gener betyder det ikke noget for den normale funktion hvilken allel der udtrykkes. Det kan fx nævnes at der findes omkring 900 gener der koder for receptorer i næsens olfaktoriske organ af betydning for vores lugtesans. I hver olfaktoriske nervecelle udtrykkes kun én allel af ét enkelt receptorgen, hvilket bevirker at den nervecelle kun reagerer på én bestemt lugt. Epigenetiske modifikationer har også sygdomsmæssig betydning, hvilket bl.a. understreges af det stigende antal sygdomme, hvor det er påvist at disse modifikationer er involveret i patogenesen. En kobling mellem DNA-metylering og cancer blev kendt for flere år siden, hvor det blev påvist at cancercellers genom er hypometyleret i forhold til normale cellers. Det er interessant at dette tab af metylering hovedsageligt er sket i de repetitive områder af genomet. Der findes også andre grupper af sygdomme, hvor forstyrret imprintning har patogenetisk betydning, eksempelvis Beckwith-Wiedemanns syndrom samt Prader-Willis og Angelmans syndromer (se nærmere herom i Kap. 15, s. 312ff.). Med baggrund i ovenstående syndromer er der nu betydelig farmakologisk interesse for at udvikle medikamina som skal kunne revertere epigenetiske abnormiteter. Mitokondrie-DNA (mtdna) En somatisk celle indeholder flere hundrede, evt. afhængigt af celletypen flere tusind mitokondrier, som igen hver især indeholder op til 10 molekyler mtdna. Der kan således forekomme mange tusind kopier af dette molekyle i hver celle. For de modne kønscellers vedkommende forholder det sig sådan at en ægcelle indeholder op mod mitokondrier, mens en sædcelle i sit langt mindre cytoplasma-volumen kun indeholder mitokondrier som yderligere under normale forhold nedbrydes efter befrugtningen book.indb 47 09/12/

44 KAPITEL 1 MENNESKETS GENOM Dette er baggrunden for at mitokondrie- DNA nedarves via ægceller, dvs. i rene kvindelinjer såkaldt maternel arvegang (Kap. 5). 9 Den forholdsmæssigt hyppige forekomst af sygdomsfremkaldende (patogene) mutationer i mtdna gør at også denne størrelsesmæssigt beskedne del af genomet har betydelig medicinsk vigtighed. Der er da også i det seneste årti sket en stærk stigning i antallet af patienter hvor man har påvist en mtdna-mutation som årsag til deres sygdom, typisk af neuromuskulær art (s. 121). Det er derfor vigtigt at man som læge er fortrolig med mitokondrie-dna og patogene mtdna-mutationers kliniske manifestationer, ligesom det ved udredning af familieanamnese og fortolkning af stamtræer er vigtigt at være opmærksom på om de foreliggende oplysninger er forenelige eller uforenelige med maternel arv (se Kap. 5, Figur 5.1e og 5.1f). Boks 1.9. Mitokondriers evolutionære baggrund Mitokondriers grundlæggende molekylærbiologi minder meget om forholdene hos bakterier og menes at afspejle at mitokondrierne er evolutionære rester af en bakterieart som i eukaryoternes (de kerneholdige organismers) tidlige evolution blev optaget i en eukaryot og indgik i et symbiotisk forhold med denne. Under årmillionernes udvikling af denne symbiose menes størstedelen af den pågældende bakteries genom gradvist at være blevet overført til eukaryotens cellekerne. En lille del af vores kernegenom er således efter al sandsynlighed fhv. mitokondriegenommateriale. 9 Der er fra Rigshospitalet publiceret det foreløbig eneste kendte tilfælde af paternel nedarvning af mitokondrie- DNA hos mennesket: Schwartz M. & J. Vissing. Paternal inheritance of mitochondrial DNA. New Engl. J. Med. 2002; 347: Parallelpublikation, Paternel nedarvning af mitokondrielt DNA i Ugeskrift for Læger 2003; 165: mtdna-molekylet og dets funktion Menneskets mtdna er et lille ringsluttet DNAmolekyle på knap basepar (16,6 kb), se Boks 1.9 og Siden 1986 har man kendt hele mitokondrie-dna ets kodende funktion (Figur 1.17). Denne del af menneskets genom var således beskrevet i detaljer flere år før den store kortlægning af det nukleære genom blev indledt. mtdna indeholder i alt 37 gener. Heraf koder 2 for ribosomalt RNA (hhv. 12S og 16S rrna), 22 koder for trna, og 13 er proteinkodende. De 13 mitokondrielle mrna er translateres alle på mitokondriets egne ribosomer under anvendelse af mitokondrielt trna og dermed i overensstemmelse med mitokondriernes genetiske kode (Tabel 1.8). Alle 13 polypeptider har desuden deres funktion i mitokondriet hvor de er engageret i den oxidative fosforylering (OXPHOS) og dermed i mitokondriernes livsvigtige syntese af ATP (adenosintrifosfat). Puriner (adenin og guanin) og pyrimidiner (cytosin og thymin) er ulige fordelt mellem mt- DNA-molekylets to strenge, hvilket er baggrunden for at den ene streng betegnes H-strengen (H = heavy), den anden L-strengen (L = light). For 12 af de 13 proteinkodende gener i mtdna samt for 14 af de 22 trna-gener og begge rrna-gener er H-strengen templatestreng ved syntesen af det primære transkript (Fig. 1.17). For den helt overvejende del af de mitokondrielle gener er L-strengen derfor den RNA-lignende streng, dvs. den streng hvis basesekvens er lig sekvensen af det funktionelle transkript, såfremt thymin (T) erstattes med uracil (U). Dette er baggrunden for at L-strengens sekvens er mitokondriegenomets referencesekvens, også ved beskrivelse af mutationer i de gener hvor L-strengen er template-streng, fx ND6 (se Tabel 5.5 s. 113) book.indb 48 09/12/

45 MITOKONDRIE-DNA (MTDNA) Kontrolregionen Leu (UUR) 16S Val 12S Phe O H Thr Pro ytb Glu ND6 H-strengen ND1 ND5 IIe Met ND2 Trp O L Gln Ala Asn ys Tyr O I L-strengen Arg Ser (UN) Gly ND3 Asp Lys O III O II ATPase 6 ATPase 8 ND4 ND4L Leu (UN) Ser (AGY) His Figur Genetisk kort over menneskets mitokondrie-dna (mtdna). Det ringsluttede DNA-molekyles to strenge, H- hhv. L-strengen, er tegnet som to koncentriske cirkler. Molekylets 37 gener er markeret som kasser (rrna- og proteingenerne) hhv. små udfyldte cirkler (trna-generne) beliggende på den af de to strenge der er template ved syntesen af genets funktionelle RNA-transkript. Gensymboler: 12S og 16S er generne for mitokondriernes to rrna-molekyler, hhv. 12S rrna og 16S rrna. ND1-ND6 er gener for subunits i enzymkomplekset NADH-dehydrogenase, OI-III er generne for subunits i enzymkomplekset cytokrom c-oxidase, ATPase6 og ATPase8 koder for subunits i ATP-syntase, og ytb for cytokrom b. De små trna-gener er markeret med trebogstavkoden for den tilhørende aminosyre (Tabel 1.3). Leucin-tRNA (Leu) og serin-trna (Ser) har hver to forskellige gener sv.t. deres to codon-familier (Tabel 1.2), jf. codon-angivelserne i de anførte parenteser (R = purin, Y = pyrimidin, N = purin el. pyrimidin). O H og O L angiver replikationsstart for hhv. den tunge og den lette streng. Kontrolregionen er ikkekodende, men indeholder foruden O H separate transkriptionsstartsekvenser for de to strenge samt to regioner med højvariable sekvenser. Molekylets basepar nummereres fortløbende fra basepar nr. 1 (i kontrolregionen) og frem, i retningen mod uret (pilen). (Adapteret fra Attardi G. The elucidation of the human mitochondrial genome. A historical perspective. BioEssays 1986;5:34-9). Tabel 1.8 Den genetiske kode for menneskets mtdna. Forskelle fra standardkoden, Tabel 1.2 odon Standardkoden mtdna AUA Ile Met UGA Stop el. Sec Trp AGA Arg Stop AGG Arg Stop book.indb 49 09/12/

46 KAPITEL 1 MENNESKETS GENOM Boks 1.10 Referencesekvensen for mitokondrie-dna (mtdna). Den første basesekvens af mtdna fra mennesket blev offentliggjort i Den var på basepar, fortløbende nummereret med et bestemt basepar i kontrolregionen som nr. 1. Det pågældende mtdna var udvundet fra en moderkage, men pga. analyseproblemer blev en lille del af sekvensen taget fra en anden persons mtdna, og da der i et par andre positioner yderligere var tvivl om analyseresultaterne, anbragte man her de basepar man entydigt havde fastlagt i de tilsvarende positioner i oksemtdna. Det blev der først rettet endeligt op på 10 år senere ved fornyet sekventering af det oprindelige placenta-mtdna. 11 Ved revisionen viste det sig at der i 1981-sekvensen var anført et basepar for meget i positionerne (i genet for 16S rrna). Den reviderede referencesekvens (rrs) er således kun på bp, men af hensyn til den allerede meget omfattende litteratur om variation i bestemte positioner, herunder vigtige patogene mutationer (Tabel 5.5, s. 113), valgte man at bibeholde den oprindelige nummerering og acceptere et hul i sekvensen sv.t. position Mitokondriegenomet er specielt, bl.a. ved at ingen af dets gener indeholder introns, ligesom der stort set heller ikke er nogen basepar mellem generne, når undtages den såkaldte kontrolregion. Det er den ca bp lange sekvens mellem generne for prolin-trna (trna Pro ) og phenylalanin-trna (trna Phe ) (Figur 1.17). Den informationsmæssige kompakthed i mtdna et understreges af at transkripterne fra de fleste af de proteinkodende gener afsluttes med en ufuldstændig stopcodon 10 Anderson S et al. Sequence and organization of the human mitochondrial genome. Nature 1981; 290: Andrews RM et al. Reanalysis and revision of the ambridge reference sequence for human mitochondrial DNA. Nature genetics 1999; 23: 147. (U eller UA) der først fuldendes til UAA ved den posttranskriptionelle polyadenylering af mrna et. Sekvensvariation i mtdna Ved rutinemæssig mtdna-analyse vil man hos de allerfleste personer kun påvise én mtdnasekvens. Denne homogene tilstand betegnes homoplasmi; dette til forskel fra den sjældnere situation hvor der påvises to forskellige sekvenser, såkaldt heteroplasmi. På populationsniveau er der til gengæld tale om en betydelig sekvensvariation mellem tilfældigt udvalgte individer; jo fjernere beslægtet kvindelinjerne er, des større er sekvensvariationen. Den langt overvejende del af sekvensvariationen mellem individer er uden fænotypiske konsekvenser og betegnes derfor som normalgenetisk variation. Størstedelen af den normalgenetiske variation forekommer i to ca. 400 bp store segmenter af kontrolregionen kaldet hypervariable regioner. Dertil kommer en del polymorfier i den kodende del af mtdna et samt dén lejlighedsvise variation der skyldes patogene mutationer (disse vil blive omtalt i Kap. 5, se afsnittet Mitokondriesygdomme, side 121ff.). Haplotyper og haplogrupper En persons mtdna-sekvens betegnes også vedkommendes mtdna-haplotype. I forbindelse med kortlægning af fordelingen af haplotyper blandt Jordens forskellige etniske grupper har man defineret en snes forskellige hovedgrupper af haplotyper, kaldet haplogrupper. Disses sekvenser har kunnet indpasses i et sammenhængende overordnet stamtræ for nutidsmenneskets mtdna med rødder i et fælles stam-mtdna hos en kvinde i Afrika for anslået år siden, populært kaldt den mitokondrielle Eva book.indb 50 09/12/

47 BETYDNING OG PERSPEKTIVER Kromosomalt DNA Transkription ellekernen Kerneproteiner Mitokondrie mtdna Transkription cdna 5 3 snrna Andre proteiner rrna mrna trna rrna mrna trna Andet fuktionelt RNA (mirna, lncrna mv.) Ribosomproteiner N Translation N Protein OXPHOS N..... Eksport til andre celler/væv Andre organeller + cytosol Figur Gen-ekspression i en celle, hhv. nukleære gener (kromosomalt DNA i cellekernen) og mitokondrielle gener (mtdna i mitokondrierne). I cellekernen dannes et primært transkript som i cellekernen processeres til det funktionelle RNA-molekyle. Bemærk at et transkript kan reverstranskriberes til DNA af viralt eller cellulært kodet revers transkriptase. DNA et kan efterfølgende integreres i det kromosomale DNA. Mitokondrierne syntetiserer deres egne rrna- og trnamolekyler samt mrna til syntese af 13 proteiner der indgår i syntesen af ATP (den oxidative fosforylering, OXPHOS). De mitokondrielle DNA- og RNA-polymeraser samt ribosomale proteiner, enzymerne i de mitokondrielle stofskifteprocesser trikarboxylsyrecyklus, fedtsyreoxidationen og urinstofcyklus samt hovedparten af proteinerne i den oxidative fosforylering kodes af nukleære gener og syntetiseres af cytosoliske ribosomer, hvorefter de importeres af mitokondrierne. angiver posttranslationelle modifikationer såsom fx glykosylering og fosforylering. Betydning og perspektiver Allerede i 1969, dvs. 20 år før det humane genomprojekt (Human Genome Project, HGP) blev sat i gang, foreslog den amerikanske kardiolog og humangenetiker Victor McKusick (Boks 1.11) at menneskets gener skulle kortlægges. Han sammenlignede en kortlægning af menneskets arvemasse med 1500-tallets banebrydende studier af menneskets anatomi og forudså at den ville få en tilsvarende revolutionerende betydning for lægevidenskaben. Boks 1.11 Victor A. McKusick Victor McKusick ( ) betragtes af mange som grundlæggeren af den moderne kliniske genetik. Han var bl.a. manden bag værket Mendelian Inheritance in Man (MIM), en omfattende katalogisering af menneskets gener og mendelske egenskaber, herunder monogene sygdomme. Først i bogform og siden tilgængelig på internettet i form af OMIM, Online Mendelian Inheritance in Man, en meget værdifuld database for klinisk genetik ( nlm.nih.gov/omim). McKusick var en af foregangsmændene i den betydningsfulde Human Genome Organisation, bedre kendt under akronymet HUGO book.indb 51 09/12/

48 KAPITEL 1 MENNESKETS GENOM Han blev sammenslutningens første præsident og satte i den grad sit præg på organisationen at man, med reference til en kendt fransk forfatter, ofte spøgefuldt omtalte den som Victors HUGO. Med det humane genomprojekts sekventering af arvemassen er det rigtignok lykkedes at så at sige fridissekere vores molekylærgenetiske anatomi og derved blotlægge den nøgne biologiske opskrift på et menneske. Men medens den klassiske anatomi meget håndgribeligt viser os menneskelegemets struktur, og i vid udstrækning giver os en umiddelbar indsigt i organsystemernes indbyrdes samspil, er genomets anatomi en ret så rodet og uoverskuelig størrelse, og udnyttelse af informationen herom stiller store faglige krav, herunder til avanceret informationsteknologi. Tilvejebringelsen af selve referencesekvensen, og dens umiddelbare tilgængelighed via internettet, har dog allerede haft stor betydning. Uanset den genetiske variation mellem individuelle genomer har den officielle referencesekvens status som genetisk norm fået afgørende betydning for konkrete daglige laboratoriediagnostiske bedømmelser af DNA-analyser af patienter og familier. Dertil kommer den udvidelse af det diagnostiske spektrum som kortlægningen har muliggjort, derved at flere og flere gener har kunnet identificeres vha. den tilvejebragte genomsekvens. Ligesom det første store big science-projekt i vor tid, Apolloprojektet om månelandingen, har HGP krævet og affødt en enorm teknologisk udvikling og konkurrence. Dette har fået betydning for alle de områder hvor molekylærgenetiske analyser er, eller netop er blevet, et centralt værktøj. Ud over den kliniske genetik, inkl. cancergenetikken og de multifaktorielle sygdomme, gælder dette bl.a. virus- og bakteriediagnostik samt retsmedicin (DNA-profilanalyser), antropologi og arkæologi (revolutionerende analyser af gammelt DNA ). Dertil kommer biologisk grundforskning i almindelighed, hvor de seneste årtiers eksponentielt voksende kortlægning af diverse biologiske arters genomer med detaljerede molekylære data kraftigt har underbygget og detailbelyst dén biologiske evolution som harles Darwin ( ) for over 150 år siden argumenterede solidt og modigt for. Sammenligninger med basesekvenser og aminosyresekvenser i hhv. gener og proteiner hos andre arter er blevet vigtige i vurderingen af de sekvensvariationer der påvises ved DNA-analyse af patienter og risikopersoner i den kliniske genetik (s. 79). Analyser af individuelle genomer for tusindvis af sekvensvariationer i form af SNP er og kopitalsvarianter i genomdækkende associationsstudier (GWAS, genomewide association studies, se Kap. 6), mhp. afklaring af det genetiske grundlag for en lang række komplekse sygdomstilstande, har i de senere år sendt laviner af resultater ud i faglitteraturen. Sideløbende har den teknologiske udvikling inden for molekylærgenetikken bragt sekvensanalyse af hele genomet hos enkeltpersoner inden for praktisk rækkevidde 12. Med den voldsomme øgning i mængden af molekylærgenetiske data bliver det en kæmpe udfordring at fortolke den diagnostiske relevans af dels de mange associationer mellem markører og sygdom der påvises ved de nævnte associationsstudier, dels de talrige sekvensvarianter som genomsekventeringerne vil byde på. Efter afklaringen af genomets struktur er den store udfordring forståelsen af dets funktion. De grundlæggende principper og molekylærbiologiske detaljer i genekspression transkription og translation er for længst blevet udredt, men 12 Det forudses at en sådan analyse inden længe vil kunne udføres for under kr. og på mindre end en uge. Til sammenligning kostede tilvejebringelsen af den første genomsekvens 2,7 milliarder US dollars og tog 13 år book.indb 52 09/12/

49 BETYDNING OG PERSPEKTIVER tilbage står afklaringen af dén koordinerede afspilning af (stam)cellers genetiske program som bevirker vævsdifferentiering og organdannelse med en selvstændig organisme som slutresultat. Svarene på de mange udestående spørgsmål herom forventes tilvejebragt gennem bl.a. den igangværende kortlægning af epigenetiske mekanismer og disses betydning for hvilke dele af genomet der udtrykkes hvor og hvornår som afspejlet i cellernes transkriptomer og proteomer. Dette vil give grundlag for en beskrivelse og forståelse af udviklingsfejl på såvel celle- som organniveau, i form af cancer og organforstyrrelser/misdannelser, med nye muligheder for forebyggelse og behandling. I dette på mange måder uoverskuelige felt er det vigtigt at holde fast i de allerede opnåede landvindinger inden for kortlægningen af det molekylærgenetiske grundlag for dé mange alvorlige monogene sygdomme der rammer familier her i landet. Denne kortlægning har muliggjort en præcis diagnostik samt et tilbud om forebyggelse af nye tilfælde i familierne gennem bl.a. fosterdiagnostik og selektiv abort. Forudsætningen for en effektiv generel forebyggelse i befolkningen er imidlertid at anlægsbærerne bliver fundet inden de får deres første barn med den pågældende sygdom. Med udviklingen af arrayteknologier (Kap. 17) er et tilbud om omkostningseffektiv molekylærgenetisk screening for kendte patogene mutationer blevet et nærliggende og vidtgående uproblematisk stort potentielt befolkningsgode som faget klinisk genetik vil kunne argumentere stærkt for at få indført book.indb 53 09/12/

På opdagelse i gernerne

På opdagelse i gernerne På opdagelse i gernerne DNA (molekyle): arvemateriale Alle vore celler er genetisk set identiske DNA: genetiske opskrifter - kogebog for cellerne = genregulering Opskrift på forskellige proteiner Vejledninger

Læs mere

Gældende fra: April 2014 (Hold SB512) Version: Endelig Side 1 af 5

Gældende fra: April 2014 (Hold SB512) Version: Endelig Side 1 af 5 Molekylærbiologiske analyser og teknikker har viden om teorien og principperne bag udvalgte molekylærbiologiske analyser og teknikker Analyser og analyseprincipper på biomolekylært, celle- og vævs- samt

Læs mere

Struktur og funktion af gener

Struktur og funktion af gener Molekylærbiologi og genetik S4, F2008 f Malene Munk Jørgensen Emne: Struktur og funktion af gener Link: undervisningsplanen for S4-molekylærbiologi og genetik MMJ, VI niversity ollege Bioanalytikeruddannelsen

Læs mere

Dansk Selskab for Medicinsk Genetik s (DSMG) politik vedrørende klinisk anvendelse af genomisk sekventering

Dansk Selskab for Medicinsk Genetik s (DSMG) politik vedrørende klinisk anvendelse af genomisk sekventering Dansk Selskab for Medicinsk Genetik s (DSMG) politik vedrørende klinisk anvendelse af genomisk sekventering De sidste 10 års store fremskridt indenfor gensekventeringsteknologi har gjort det muligt at

Læs mere

Cellekernen (Nucleus) Sebastian Frische Anatomisk Institut

Cellekernen (Nucleus) Sebastian Frische Anatomisk Institut Cellekernen (Nucleus) Sebastian Frische Anatomisk Institut Cellekernen Cellekernens overordnede struktur kernemembranen/nucleolemma kromatin nucleolus Cellecyklus faser i cellecyklus faser i mitosen Størrelse:

Læs mere

Velkommen. Test dit eget DNA med PCR. Undervisningsdag på DTU Systembiologi. Undervisere: Sebastian, Louise og Ana

Velkommen. Test dit eget DNA med PCR. Undervisningsdag på DTU Systembiologi. Undervisere: Sebastian, Louise og Ana Velkommen Test dit eget DNA med PCR Undervisningsdag på DTU Systembiologi Undervisere: Sebastian, Louise og Ana Hvem er I? 2 DTU Systembiologi, Danmarks Tekniske Universitet Dagens program 9:00 10:00 Introduktion

Læs mere

Generne bestemmer. Baggrundsviden og progression: Niveau: 8. klasse. Varighed: 12 lektioner

Generne bestemmer. Baggrundsviden og progression: Niveau: 8. klasse. Varighed: 12 lektioner Generne bestemmer Niveau: 8. klasse Varighed: 12 lektioner Præsentation: Generne bestemmer er et forløb om genernes indflydelse på individet. I forløbet kommer vi omkring den eukaryote celle, celledeling,

Læs mere

Velkommen. Test dit eget DNA med PCR. Undervisningsdag på DTU Systembiologi. Undervisere:

Velkommen. Test dit eget DNA med PCR. Undervisningsdag på DTU Systembiologi. Undervisere: Velkommen Test dit eget DNA med PCR Undervisningsdag på DTU Systembiologi Undervisere: Hvem er I? 2 DTU Systembiologi, Danmarks Tekniske Universitet Hvilke baser indgår i DNA? A. Adenin, Guanin, Cytosin,

Læs mere

Det lyder enkelt, men for at forstå hvilket ærinde forskerne er ude i, er det nødvendigt med et indblik i, hvordan celler udvikles og specialiseres.

Det lyder enkelt, men for at forstå hvilket ærinde forskerne er ude i, er det nødvendigt med et indblik i, hvordan celler udvikles og specialiseres. Epigenetik Men hvad er så epigenetik? Ordet epi er af græsk oprindelse og betyder egentlig ved siden af. Genetik handler om arvelighed, og hvordan vores gener videreføres fra generation til generation.

Læs mere

Deoxyribonukleinsyre

Deoxyribonukleinsyre DNAs Forunderlige struktur Ved Rebecca E.-Sørensen stud.scient i medicinalkemi ved Aarhus Universitet Deoxyribonukleinsyre Strukturen af DNA findes af James D. Watson og Francis H. Crick i 1953 1 Nuklein

Læs mere

1. Hvad er kræft, og hvorfor opstår sygdommen?

1. Hvad er kræft, og hvorfor opstår sygdommen? 1. Hvad er kræft, og hvorfor opstår sygdommen? Dette kapitel fortæller om, cellen, kroppens byggesten hvad der sker i cellen, når kræft opstår? årsager til kræft Alle levende organismer består af celler.

Læs mere

PCR (Polymerase Chain Reaction): Opkopiering af DNA

PCR (Polymerase Chain Reaction): Opkopiering af DNA PCR (Polymerase Chain Reaction): Opkopiering af DNA PCR til at opkopiere bestemte DNA-sekvenser i en prøve er nu en af genteknologiens absolut vigtigste værktøjer. Peter Rugbjerg, Biotech Academy PCR (Polymerase

Læs mere

Biologi opgave Opsamling: Cellebiologi (Bioanalytiker modul3)

Biologi opgave Opsamling: Cellebiologi (Bioanalytiker modul3) 1 Delphine Bonneau Biologi opgave Opsamling: Cellebiologi 1-6 Pelle har spist en kæmpe stor kage, og efterfølgende stiger hans blodsukker. Derfor sender kroppen besked til de endokrine kirtler i bugspytkirtlen

Læs mere

Caseuge 1.1: Anatomi og fysiologi

Caseuge 1.1: Anatomi og fysiologi Modulplan for modul 1.1, Introduktion til basalfagene, 2017 Vigtigt: Modulplanens læringsmål angiver pensum. I tillæg til læringsmålene for forelæsninger, studiesal, kliniske øvelser og kliniske ophold,

Læs mere

Cellens livscyklus GAP2. Celledeling

Cellens livscyklus GAP2. Celledeling Cellens livscyklus Cellens livscyklus inddeles i to faser, interfase og mitose. GAP1 (G1). Tiden lige efter mitosen hvor der syntetiseres RNA og protein. Syntese fasen. Tidsrummet hvor DNAet duplikeres

Læs mere

Genetiske Aspekter af HCM hos Kat. - en introduktion til forskningsprojektet

Genetiske Aspekter af HCM hos Kat. - en introduktion til forskningsprojektet Genetiske Aspekter af HCM hos Kat - en introduktion til forskningsprojektet Cand. scient. Mia Nyberg, ph.d. stud. [email protected] IMHS, Det Biovidenskabelige Fakultet, Københavns Universitet, Klinisk Biokemisk

Læs mere

X bundet arvegang. Information til patienter og familier. 12 Sygehus Lillebælt, Vejle Klinisk Genetik Kabbeltoft 25 7100 Vejle Tlf: 79 40 65 55

X bundet arvegang. Information til patienter og familier. 12 Sygehus Lillebælt, Vejle Klinisk Genetik Kabbeltoft 25 7100 Vejle Tlf: 79 40 65 55 12 Sygehus Lillebælt, Vejle Klinisk Genetik Kabbeltoft 25 7100 Vejle Tlf: 79 40 65 55 X bundet arvegang Århus Sygehus, Bygn. 12 Århus Universitetshospital Nørrebrogade 44 8000 Århus C Tlf: 89 49 43 63

Læs mere

Kvægavlens teoretiske grundlag

Kvægavlens teoretiske grundlag Kvægavlens teoretiske grundlag Lige siden de første husdyrarter blev tæmmet for flere tusinde år siden, har mange interesseret sig for nedarvningens mysterier. Indtil begyndelsen af forrige århundrede

Læs mere

Epigenetik Arv er andet end gener

Epigenetik Arv er andet end gener Epigenetik Arv er andet end gener Indhold Indledning Afsnit1: Epigenetik og DNA Afsnit 2: DNA, nukleosomer og kromatin Afsnit 3: Epigenetik og celledifferentiering Afsnit 4: Genetisk ens individer kan

Læs mere

Biologiske signaler i graviditeten - Genetisk information

Biologiske signaler i graviditeten - Genetisk information Biologiske signaler i graviditeten - Genetisk information 2 I forbindelse med vores studie af graviditeten ønsker vi at foretage undersøgelser af arvematerialet (DNA og RNA). Disse genetiske undersøgelser

Læs mere

2018 DSMG. Policy paper: Klinisk anvendelse af omfattende genomisk sekventering. Dansk Selskab for Medicinsk Genetik

2018 DSMG. Policy paper: Klinisk anvendelse af omfattende genomisk sekventering. Dansk Selskab for Medicinsk Genetik Policy paper: Klinisk anvendelse af omfattende genomisk sekventering 2018 DSMG Dansk Selskab for Medicinsk Genetik Arbejdsgruppens medlemmer: Allan Højland, reservelæge, Klinisk Genetisk Afdeling, Aalborg

Læs mere

Dansk resumé for begyndere

Dansk resumé for begyndere Dansk resumé for begyndere Dansk resumé for begyndere Dette afsnit introducerer bakteriel genregulation for enhver uden forudgående kendskab til dette emne. Alle nødvendige, videnskabelige betegnelser

Læs mere

X bundet arvegang. Information til patienter og familier

X bundet arvegang. Information til patienter og familier X bundet arvegang Information til patienter og familier 2 X bundet arvegang Følgende er en beskrivelse af, hvad X bundet arvegang betyder og hvorledes X bundne sygdomme nedarves. For at forstå den X bundne

Læs mere

Opgave 1 Listeria. mørkviolette bakteriekolonier, se figur 1a. og b. 1. Angiv reaktionstypen for reaktion. 1 vist i figur 1b.

Opgave 1 Listeria. mørkviolette bakteriekolonier, se figur 1a. og b. 1. Angiv reaktionstypen for reaktion. 1 vist i figur 1b. Opgave 1 Listeria Bakterien Listeria monocytogenes kan være sygdomsfremkaldende for personer, der i forvejen er svækkede. For at identificere Listeria kan man anvende indikative agarplader. Her udnyttes

Læs mere

Proteiner. Proteiner er molekyler der er opbygget af "aminosyrer",nogle er sammensat af få aminosyrer medens andre er opbygget af mange tusinde

Proteiner. Proteiner er molekyler der er opbygget af aminosyrer,nogle er sammensat af få aminosyrer medens andre er opbygget af mange tusinde Proteiner Proteiner er molekyler der er opbygget af "aminosyrer",nogle er sammensat af få aminosyrer medens andre er opbygget af mange tusinde Der findes ca. 20 aminosyrer i menneskets organisme. Nogle

Læs mere

Kjers. sygdom. Nyt fra forskningsfronten. Et studie der søger at påvise årsager til og behandling af denne hidtil uhelbredelige øjensygdom

Kjers. sygdom. Nyt fra forskningsfronten. Et studie der søger at påvise årsager til og behandling af denne hidtil uhelbredelige øjensygdom Kjers Nyt fra forskningsfronten sygdom Gitte Juul Almind Reservelæge, ph.d.-stud. Kennedy Centret Illustrationer: Mediafarm arvelig synsnerveskrumpning (ADOA - Autosomal Dominant Opticus Atrofi) Et studie

Læs mere

Menneskets væskefaser

Menneskets væskefaser Menneskets væskefaser Mennesket består af ca. 60% væske (vand) Overordnet opdelt i to: Ekstracellulærvæske og intracellulærvæske Ekstracellulærvæske udgør ca. 1/3 Interstitielvæske: Væske der ligger mellem

Læs mere

Bioteknologi A. Gymnasiale uddannelser. Vejledende opgavesæt 1. Mandag den 31. maj 2010 kl. 9.40-14.40. 5 timers skriftlig prøve

Bioteknologi A. Gymnasiale uddannelser. Vejledende opgavesæt 1. Mandag den 31. maj 2010 kl. 9.40-14.40. 5 timers skriftlig prøve Vejledende opgavesæt 1 Bioteknologi A Gymnasiale uddannelser 5 timers skriftlig prøve Vejledende opgavesæt 1 Mandag den 31. maj 2010 kl. 9.40-14.40 Side 1 af 8 sider pgave 1. Genmodificeret ris Vitamin

Læs mere

2. Otte barrierer. Cellens naturlige forsvar mod kræft

2. Otte barrierer. Cellens naturlige forsvar mod kræft 2. Cellens naturlige forsvar mod kræft Dette kapitel fortæller, hvordan en normal celle kan blive til en kræftcelle hvorfor kræft er en genetisk sygdom hvad der hindrer kræftudvikling Dine celler kan nå

Læs mere

Kromosomforandringer. Information til patienter og familier

Kromosomforandringer. Information til patienter og familier 12 Odense: Odense Universitetshospital Sdr.Boulevard 29 5000 Odense C Tlf: 65 41 17 25 Kromosomforandringer Vejle: Sygehus Lillebælt, Vejle Klinisk Genetik Kabbeltoft 25 7100 Vejle Tlf: 79 40 65 55 Århus:

Læs mere

CELLE OG VÆVSLÆRE 1 LEKTION 1. Nima Kalbasi, DDS Anatomi og fysiologi

CELLE OG VÆVSLÆRE 1 LEKTION 1. Nima Kalbasi, DDS Anatomi og fysiologi CELLE OG VÆVSLÆRE 1 LEKTION 1 Nima Kalbasi, DDS Anatomi og fysiologi Dagens emner Introduktion Cellemembranen Cytoplasmaet og dets struktur Cellekernen (nukleus) Celledelingen Genetik (arvelighedslære)

Læs mere

Kromosomforandringer. Information til patienter og familier

Kromosomforandringer. Information til patienter og familier Kromosomforandringer Information til patienter og familier 2 Kromosomforandringer Den følgende information er en beskrivelse af kromosomforandringer, hvorledes de nedarves og hvornår dette kan medføre

Læs mere

# Problemet med genetisk ustabilitet

# Problemet med genetisk ustabilitet Forskningsnyheder om Huntingtons Sygdom På hverdagssprog Skrevet af forskere. Til det globale HS-fællesskab Et DNA-reparerende protein ændrer stabiliteten af lange CAG-områder i det muterede gen for Huntingtons

Læs mere

Cellen og dens funktioner

Cellen og dens funktioner Eksamensopgaver Biologi C, 17bic80 6. og 7. juni 2018 1 Cellen og dens funktioner 1. Redegør for hvordan eukaryote og prokaryote celler i hovedtræk er opbygget, herunder skal du gøre rede for forskelle

Læs mere

Studieplan Molekylærbiologi Semester 3

Studieplan Molekylærbiologi Semester 3 OMRÅDET FOR SUNDHEDSUDDANNELSER Studieplan Molekylærbiologi Semester 3 Bioanalytikeruddannelsen i Odense Efterår 2017 Semester 3 Indhold 1. Fagets fokus og emner... 3 2. Lektionsplan... 4 3. Litteraturliste...

Læs mere

Undervisningsbeskrivelse

Undervisningsbeskrivelse Undervisningsbeskrivelse Stamoplysninger til brug ved prøver til gymnasiale uddannelser Termin Maj-juni 2015 Institution Voksenuddannelsescenter Frederiksberg Uddannelse Fag og niveau Lærer(e) Hold STX

Læs mere

Pandoras æske eller vejen til forebyggelse af sygdomme?

Pandoras æske eller vejen til forebyggelse af sygdomme? Genetisk hornhindediagnostik: Pandoras æske eller vejen til forebyggelse af sygdomme? Genteknologi et vigtigt værktøj til forebyggelse af hornhindesygdomme? Genetisk diagnostik og dets anvendelsesmuligheder

Læs mere

Personlig medicin i genetisk rådgivning og udredning

Personlig medicin i genetisk rådgivning og udredning Personlig medicin i genetisk rådgivning og udredning Elsebet Østergaard Overlæge, Klinisk Genetisk Klinik, Rigshospitalet Formand, Dansk Selskab for Medicinsk Genetik Genetisk rådgivning og udredning før

Læs mere

Eksamensspørgsmål Biologi C maj-juni 2014 Sygeeksamen: 4cbicsy1

Eksamensspørgsmål Biologi C maj-juni 2014 Sygeeksamen: 4cbicsy1 Eksamensspørgsmål Biologi C maj-juni 2014 Sygeeksamen: 4cbicsy1 HF og VUC Nordsjælland. Helsingørafdelingen Lærer: Lisbet Heerfordt, Farumgårds Alle 11, 3520 Farum, tlf. 4495 8708, mail: [email protected].

Læs mere

EKSAMENSOPGAVER. Eksamensopgaver uden bilag

EKSAMENSOPGAVER. Eksamensopgaver uden bilag EKSAMENSOPGAVER Eksamensopgaver uden bilag Eksaminator: Morten Sigby-Clausen (MSC) 1. Celler, fotosyntese og respiration 2. Den naturlige å og vandløbsforurening 3. Kost og ernæring 4. DNA og bioteknologi

Læs mere

Bilag A Ordforklaringer

Bilag A Ordforklaringer Bilag A Aldersstandardisere Justere talmateriale, så kræftudvik- 16, 17, 18 lingen kan sammenlignes uanset forskelle i aldersfordelingen, f.eks. mellem to lande. Allel De to "ens" genkopier i alle celler

Læs mere

Genetiske undersøgelser i graviditeten

Genetiske undersøgelser i graviditeten Til patienter og pårørende Genetiske undersøgelser i graviditeten Vælg billede Vælg farve Klinisk Genetisk Afdeling (KGA) Denne folder henvender sig til dig, der er gravid, og som har fået tilbudt en genetisk

Læs mere

Eksamensspørgsmål til biocu til mandag d. 10. juni 2013

Eksamensspørgsmål til biocu til mandag d. 10. juni 2013 Eksamensspørgsmål til biocu til mandag d. 10. juni 2013 Nr. 1. Fra gen til protein. Hvordan er sammenhængen mellem DNA ets nukleotider og proteinets aminosyrer? Beskriv hvad der sker ved henholdsvis transskription

Læs mere

Banan DNA 1/6. Formål: Formålet med øvelsen er at give eleverne mulighed for at se DNA strenge med det blotte øje.

Banan DNA 1/6. Formål: Formålet med øvelsen er at give eleverne mulighed for at se DNA strenge med det blotte øje. Banan DNA Formål: Formålet med øvelsen er at give eleverne mulighed for at se DNA strenge med det blotte øje. Baggrundsviden: Om vi er mennesker, dyr eller planter, så har alle organismer DNA i deres celler.

Læs mere

Avl på honningbier det genetiske grundlag I

Avl på honningbier det genetiske grundlag I Avl på honningbier det genetiske grundlag I Egenskaber ved alle levende væsner bestemmes af 2 ting: Arv Miljø Grundlaget for alt avlsarbejde er at mange egenskaber nedarves. Hvad er arv og hvad er miljø

Læs mere

Reciprok translokation

Reciprok translokation Patientinformation Reciprok translokation Ægsortering Præimplantationsdiagnostik (PGD) Fertilitetsklinikken Gynækologisk Obstetrisk Afdeling D Ægsortering Hvad er præimplantationsdiagnostik? Ved præimplantationsdiagnostik,

Læs mere

Undervisningsbeskrivelse

Undervisningsbeskrivelse Undervisningsbeskrivelse Stamoplysninger til brug ved prøver til gymnasiale uddannelser Termin December/januar 13-14 Institution Vestegnen HF VUC Albertslund og Rødovre Uddannelse Fag og niveau Lærer(e)

Læs mere

Eksamen: Biologi C-niveau 2a bi

Eksamen: Biologi C-niveau 2a bi Eksamen: Biologi C-niveau 2a bi Dato: 3.6.2015 Eksaminator: Carsten Sejer Christiansen Censor: Hans Christian Ihler Hold: 2a bi Elever: 8 Eksamensform: - Trækning af eksamensspørgsmål inkl. bilag - 24

Læs mere

Bachelor i Medicin og Medicin med Industriel Specialisering

Bachelor i Medicin og Medicin med Industriel Specialisering Eksamen 2015 Titel på kursus: Uddannelse: Semester: Introduktion til basalfagene Bachelor i Medicin og Medicin med Industriel Specialisering 1. semester Eksamensdato: 09-02-2016 Tid: kl. 09.00-13.00 Bedømmelsesform:

Læs mere

Ekstrakter - rammebevillinger

Ekstrakter - rammebevillinger Ekstrakter - rammebevillinger Professor Bente Vilsen Aarhus Universitet Biokemi 4.736.000 kr. Natrium-kalium pumpen sidder i membranen på alle celler og er livsnødvendig for at opretholde deres funktion.

Læs mere

Nr 1. Fra gen til protein

Nr 1. Fra gen til protein Nr 1 Fra gen til protein Med udgangspunkt i vedlagte illustrationer bedes du besvare følgende: Hvordan er sammenhængen mellem DNA ets nukleotider og proteinets aminosyrer? Beskriv hvad der sker ved henholdsvis

Læs mere

Biomarkører ved neurologiske sygdomme. Thomas Christensen

Biomarkører ved neurologiske sygdomme. Thomas Christensen Biomarkører ved neurologiske sygdomme Thomas Christensen Biomarkører ved neurologiske sygdomme Identificere diagnostiske og prognostiske biomarkører for neurologiske sygdomme Biobank oprettet Samarbejde

Læs mere

Ordinær vintereksamen 2016/17

Ordinær vintereksamen 2016/17 Ordinær vintereksamen 2016/17 Titel på kursus: Uddannelse: Semester: Introduktion til basalfagene Medicin og Medicin med Industriel Specialisering 1. semester Eksamensdato: 04-01-2017 Tid: 9.00-13.00 Bedømmelsesform

Læs mere

5. februar Kompetencekort Cytogenetik

5. februar Kompetencekort Cytogenetik Kompetencekort Cytogenetik 5. februar 2015 Kompetencer i målbeskrivelsen (I= introduktionsstilling, H= Hoveduddannelse) som er dækket af denne konkretisering: I I I H H H Beskrive (1) kromosomstruktur,

Læs mere

DIAGNOSTISKE TEKNIKKER VED PGD (PGT) - MOLEKYLÆRBIOLOGI FOR LÆGER OG ANDRE

DIAGNOSTISKE TEKNIKKER VED PGD (PGT) - MOLEKYLÆRBIOLOGI FOR LÆGER OG ANDRE DIAGNOSTISKE TEKNIKKER VED PGD (PGT) - MOLEKYLÆRBIOLOGI FOR LÆGER OG ANDRE I N GE SØKILDE P E D E RSEN, K L I N I S K L A B ORATORIEGENETIKER, P H D AFSNIT FOR MOLEKYLÆR DIAGNOSTIK - AAUH PGT ARBEJDSGANG

Læs mere

Danmarks Tekniske Universitet

Danmarks Tekniske Universitet Side 1 of 14 Danmarks Tekniske Universitet Skriftlig prøve, den 21/1-2013 Kursus navn: Kursus nr. 27633 Introduktion til Bioinformatik Tilladte hjælpemidler: Alle "Vægtning" Angivet ved de individuelle

Læs mere

Forskningsnyheder om Huntingtons Sygdom På hverdagssprog Skrevet af forskere. Til det globale HS-fællesskab Træning øger cellulært genbrug

Forskningsnyheder om Huntingtons Sygdom På hverdagssprog Skrevet af forskere. Til det globale HS-fællesskab Træning øger cellulært genbrug Forskningsnyheder om Huntingtons Sygdom På hverdagssprog Skrevet af forskere. Til det globale HS-fællesskab Træning øger cellulært genbrug Træning øger genbrug i museceller. Er det derfor, at motion er

Læs mere

Undervisningsbeskrivelse

Undervisningsbeskrivelse Undervisningsbeskrivelse Stamoplysninger til brug ved prøver til gymnasiale uddannelser Termin Maj-juni 2014 Institution Voksenuddannelsescenter Frederiksberg Uddannelse Fag og niveau Lærer(e) Hold Stx

Læs mere

Genekspression. GENEKSPRESSION side 1

Genekspression. GENEKSPRESSION side 1 Genekspression 2006 GENEKSPRESSION side 1 Indholdsfortegnelse Kapitel 1... 3 Proteinsyntese... 3 Regulering af gener i E. coli.... 8 Transskription hos eukaryoter... 14 Eukaryot genregulering... 16 Efterbehandlig

Læs mere

Eksamensspørgsmål til BiB biologi B 2015

Eksamensspørgsmål til BiB biologi B 2015 Eksamensspørgsmål til BiB biologi B 2015 Med udgangspunkt i de udleverede bilag og temaet evolution skal du: 1. Redegøre for nogle forskellige teorier om evolution, herunder begrebet selektion. 2. Analysere

Læs mere

Studiespørgsmål til celler og væv

Studiespørgsmål til celler og væv Studiespørgsmål til celler og væv 1. Hvad er en celle og hvad vil det sige, at den har et stofskifte? 2. Tegn en figur af en celle og navngiv, på figuren, de vigtigste organeller. Hvad er navnet på den

Læs mere

Patterns of Single-Gene Inheritance

Patterns of Single-Gene Inheritance Patterns of Single-Gene Inheritance Mendels 1. lov: hvis en mand er heterozygot, Aa, vil halvdelen af sædcellerne indeholde A, halvdelen a. hvis en kvinde er heterozygot, vil halvdelen af ægcellerne ligeledes

Læs mere

En forsker har lavet et cdna insert vha PCR og har anvendt det følgende primer sæt, som producerer hele den åbne læseramme af cdna et:

En forsker har lavet et cdna insert vha PCR og har anvendt det følgende primer sæt, som producerer hele den åbne læseramme af cdna et: F2011-Opgave 1. En forsker har lavet et cdna insert vha PCR og har anvendt det følgende primer sæt, som producerer hele den åbne læseramme af cdna et: Forward primer: 5 CC ATG GGT ATG AAG CTT TGC AGC CTT

Læs mere

EKSAMENSOPGAVER. Eksamensopgaver uden bilag

EKSAMENSOPGAVER. Eksamensopgaver uden bilag EKSAMENSOPGAVER Eksamensopgaver uden bilag Eksaminator: Morten Sigby-Clausen (MSC) 1. Celler og celledeling 2. Kost, fordøjelse og ernæring 3. Blodkredsløbet og åndedrætssystemet 4. Nedarvning af udvalgte

Læs mere

Proteiner: en introduktion. Modul 1; F13 Rolf Andersen, 18/2-2013

Proteiner: en introduktion. Modul 1; F13 Rolf Andersen, 18/2-2013 Proteiner: en introduktion Modul 1; F13 Rolf Andersen, 18/2-2013 4 facts om proteiner Proteiner udgør én af de vigtigste stofgrupper i vores organisme; de varetager en lang række forskellige funktioner.

Læs mere

Eksamen: Biologi C-niveau

Eksamen: Biologi C-niveau Eksamen: Biologi C-niveau Eksaminator: Tonje Kjærgaard Petersen Censor: Peter Mott Elever: 8 Eksamensform: - Trækning af eksamensspørgsmål inkl. bilag - 24 min. forberedelse - 24 min. Eksamination (18-19

Læs mere

Forskningsnyheder om Huntingtons Sygdom På hverdagssprog Skrevet af forskere. Til det globale HS-fællesskab Ofte stillede spørgsmål, januar 2011

Forskningsnyheder om Huntingtons Sygdom På hverdagssprog Skrevet af forskere. Til det globale HS-fællesskab Ofte stillede spørgsmål, januar 2011 Forskningsnyheder om Huntingtons Sygdom På hverdagssprog Skrevet af forskere. Til det globale HS-fællesskab Ofte stillede spørgsmål, januar 2011 Svar på ofte stillede spørgsmål om HD - den første i en

Læs mere

Undervisningsbeskrivelse

Undervisningsbeskrivelse Undervisningsbeskrivelse Stamoplysninger til brug ved prøver til gymnasiale uddannelser Termin Skoleåret 2015/2016, eksamen dec/jan 2015 Institution VUC Vest Uddannelse Fag og niveau Lærer(e) Hold Hfe

Læs mere

Ekstraordinær re-eksamen 2015

Ekstraordinær re-eksamen 2015 Ekstraordinær re-eksamen 2015 Titel på kursus: Uddannelse: Semester: Introduktion til basalfagene Bachelor i Medicin og Medicin med Industriel Specialisering 1. semester Eksamensdato: 04-08-2016 Tid: kl.

Læs mere

Identifikation af potentielle microrna gener ved hjælp af komparativ genomanalyse

Identifikation af potentielle microrna gener ved hjælp af komparativ genomanalyse Identifikation af potentielle microrna gener ved hjælp af komparativ genomanalyse Per Tøfting 11. juli 2008 Speciale i softwarekonstruktion IT-Vest Aarhus Universitet INDHOLD i Indhold 1 Indledning 1 1.1

Læs mere

Undervisningsbeskrivelse

Undervisningsbeskrivelse Undervisningsbeskrivelse Stamoplysninger til brug ved prøver til gymnasiale uddannelser Termin december-januar 2017/2018 Institution Vestegnen HF & VUC Uddannelse Fag og niveau Lærer Hold HFe Biologi C,

Læs mere

Elevens uni-login: Skolens navn: Tilsynsførendes underskrift: FP9. 9.-klasseprøven BIOLOGI

Elevens uni-login: Skolens navn: Tilsynsførendes underskrift: FP9. 9.-klasseprøven BIOLOGI Elevens uni-login: Skolens navn: Tilsynsførendes underskrift: FP9 9.-klasseprøven BIOLOGI Maj 2016 B1 Indledning Rejsen til Mars Det er blevet muligt at lave rumrejser til Mars. Muligheden for bosættelser

Læs mere

Specialevejledning for klinisk genetik

Specialevejledning for klinisk genetik Specialevejledning for klinisk genetik Specialebeskrivelse Klinisk genetik er et tværgående speciale og omfatter diagnostik af og rådgivning om genetisk betingede sygdomme og tilstande til patienter og

Læs mere

Gener, biologiske markører og valg af den rigtige behandling

Gener, biologiske markører og valg af den rigtige behandling Gener, biologiske markører og valg af den rigtige behandling Et spørgsmål om at udnytte viden, teknologi og sundhedsresurser optimalt Vi oplever i disse år en sand revolution i udviklingen af nye teknologier

Læs mere

Undervisningsbeskrivelse

Undervisningsbeskrivelse Undervisningsbeskrivelse Stamoplysninger til brug ved prøver til gymnasiale uddannelser Termin August-januar 2015 Institution Vestegnen hf og VUC Uddannelse Fag og niveau Lærer(e) Hold Hfe Biologi C Lene

Læs mere

non-hodgkin lymfom Børnecancerfonden informerer

non-hodgkin lymfom Børnecancerfonden informerer non-hodgkin lymfom i non-hodgkin lymfom 3 Årsagen til, at NHL hos børn opstår, kendes endnu ikke. I mange tilfælde af NHL kan der i kræftcellernes arvemateriale påvises forandringer, der forklarer, hvorfor

Læs mere

Livets molekylære kode

Livets molekylære kode 4. ÅR R. 2 / 2006 Livets molekylære kode -kemi og biologi mødes D livets molekylære kode D findes i alle levende organismer og indeholder koden til organismen informationer, der afgør om organismen er

Læs mere

Undervisningsbeskrivelse

Undervisningsbeskrivelse Undervisningsbeskrivelse Stamoplysninger til brug ved prøver til gymnasiale uddannelser Termin Januar 2016 Institution VUC Hvidovre-Amager Uddannelse Fag og niveau Lærer(e) Hold Hfe Biologi C Stig Haas

Læs mere