Immunologisk Bioinformatik

Størrelse: px
Starte visningen fra side:

Download "Immunologisk Bioinformatik"

Transkript

1 Immunologisk Bioinformatik Et undervisningsmateriale til de danske gymnasier Af Isa Kristina Kirk Materialet er lavet af Isa Kristina Kirk for Biotech Academy ved Danmarks Tekniske Universitet, DTU, i samarbejde Center for Biologisk Sekvensanalyse på DTU Systembiologi, Danske Science Gymnasier og støttet af Undervisningsministeriet, afdelingen for gymnasielle uddannelser.

2 Introduktion Velkommen til undervisningsmaterialet Immunologisk bioinformatik. Materialet indeholder I) beskrivelse samt guide til nogle af de bioinformatisk relaterede programmer og databaser, der er tilgænglige online og II) fire tilhørende øvelser der arbejder med brugen og forståelsen af programmerne. Hver øvelse er indelt i 3-4 underøvelser, der både kan laves individuelt eller som en hel øvelse i et samlet forløb. Udover ovenstående er fire biologisk-relaterede emner beskrevet i afsnittet Teori. Disse teoridele er mere dybtegående end programbeskrivelserne, og vil bidrage til bedre forståelse af de emner der indgår i programmerne, databaserne og øvelserne arbejder med. Undervisningsmaterialet findes også som en online udgave gennem Biotech Academys hjemmeside her, og i denne udgave vil der være links til programmer, relevant ekstra materiale samt interne links til materialet. Gennem Biotech Academys lærerindgang vil besvarelserne til øvelserne kunne finde. Lærerindgangen findes her. Rigtig god fornøjelse! Isa Kristina Kirk Stud. M.Sc. i Systembiologi ved Danmarks Teksniske Universitet, DTU Projektudvikler hos Biotech Academy ved DTU Systembiologi Januar 2012

3 Oversigt Teori... 4 Codons og læserammer... 5 Fylogeni... 8 Proteinstruktur Sekvens alignment Portefølje i bioinformatik øvelser Programmer og Databaser Basic Local Alignment Search Tool (BLAST) FigTree National Center for Biotechnology Information (NCBI) og Genbank Protein Databank (PDB) og Genbank PyMol UniProt Virtual Ribosome Øvelser Aktin, fra mrna til tredimensionelt protein Myostatins proteininteraktioner og organismers slægtsskab Bioinformatisk analyse afantistoffer Identifikation og visualisering af ukendt protein Ekstra materiale Ordforklaring... 74

4 Teori Teoridelen giver en beskrivelse af de biologiske områder som skal kendes for at kunne bruge og forstå de programmer der arbejdes med i porteføljen. I hver teori del henvises der til hvilke programmer der benytter den givne teori. Oversigt over teorien: Codon og læserammer Fylogeni Proteinstruktur Sekvens alignment

5 Codons og læserammer I programmet Virtual Ribosome benytter man viden omkring codons og læserammer til at finde det protein der er kodet af en given DNAsekvens. Viden omkring codons og læserammer er derfor vigtig for at kunne bruge programmet og fortolke resultatet. Codons DNA er et makromolekyler der indeholder en organismes arvemateriale. En DNA-sekvens indeholder normalt et gen, der koder for et protein. Den samlede process fra DNA til protein betegnes det centrale dogme og består blandt andet af de to trin transkription (fra DNA til messenger RNA) og translation (fra messenger RNA til protein). Læs mere om det centrale dogme fra Biotech Academy projektet, der beskriver det her. DNA molekyler er sammensat af nukleotider (Se infoboks 1). Under translationen til protein aflæses DNA-sekvensen som codons (se infoboks 2). Hver codon aflæses til netop en aminosyre, dvs. tre nukleotider bliver til en aminosyre. Der kan dannes i alt 64 forskellige codons (4³) som således oversættes til forskellige aminosyrer samt stop codons. Figur 1 viser en codon translaterings tabel, hvor det kan ses hvilke codon der koder for hvilken aminosyre. Det ses, at flere codons koder for den samme aminosyre og at codons også koder for start- og stopcodons. Startog stop-codons fortæller hvor translationen fra mrna til protein skal henholdsvis starte og stoppe på mrna sekvensen. Infoboks 1 Byggestenene for DNA er nukleotider. Der findes fire forskellige slags: Adenin (A), Cytosin (C), Guanin (G) og Thymin (T), der sammen kan sætte sig sammen og danne en DNA streng. To DNA strenge kan bindes til hinanden og dermed lave den kendte DNA struktur: dobbelt helixen. I helixen binder nukleotiderne A & T og C & T til hinanden og dermed stabiliseres DNA helixen Infoboks 2 En codon er en samling af tre nukleotider, der sammen oversættes til netop en aminosyre. Der er 4 nukleotider hvilket er ensbetydende med, at der findes 64 (4³) mulige codons. Figur 1. Codon translations tabel. Klik for at se den i stor format.

6 Læserammer Da DNA-sekvens aflæses codons (tre nukleotider) og ikke en nukleotid af gangen, kan der dannes forskellige aminosyrekæder alt afhængig af, hvilken position på DNA-sekvensen translationen starter. Dette betegnes, at DNA-sekvensen har forskellige læserammer (se infoboks 3). Antallet af læserammer (forskellige aminosyresekvenser), der kan dannes pr. DNA streng er dog begrænset til tre. Grunden til dette er, at en codon som nævnt består af tre nukleotider og dermed aflæses DNA-sekvensen tre nukleotider af gangen. Hvis man starter translationen på position 1 eller position 4 vil man således benytte den samme læseramme, og man vil dermed få den samme aminosyresekvens (dog uden den første aminosyre hvis man starter på position 4. Den samme aminosyrekæde vil fås hvis man starter på position 7, blot uden de to første aminosyrer etc. Hvis man starter på position 2, 5, 8... vil man få aminosyresekvensen fra læseramme 2. Denne aminosyresekvens vil være en anden end den fra læseramme 1 hvor man startede på position 1, 4, 7... Til slut er det samme gældende for læseramme 3, hvor aminosyresekvensen bliver translateret fra position 3, 6, 9..., se figur 2. Infoboks 3 En læseramme betegner de mulige måder en DNA-/RNAsekvens kan aflæses på. Da codons er tripletter af nukleotider, er der tre forskellige muligheder hvorpå en DNA-/RNA-sekvens kan aflæses. Disse tre måder beteges tre forskellige læserammer, som hver vil give en specifik aminosyresekve ns. De tre læserammer starter aflæsningen fra enten position 1, 4, 7 etc., 2, 5, 8 etc. eller 3, 6, 9 etc. Figur 2. Læserammer. Hver DNA-streng har tre forskellige læserammer alt afhængig af startpositionen for aflæsningen. Hver start position er markeret med en bestemt farve, og det ses, at der dannes forskellige aminosyrekæder alt afhængig af hvilken læserammer der bliver brugt. Da DNA-molekyler er sat sammen af to DNA-strenge i en dobbelt DNA helix, findes der ikke kun 3 læserammer, men faktisk 6 forskellige

7 læserammer for hvert DNA-molekyle; 3 forskellige læserammer på hver DNA-streng. Læserammen mellem to stop codons betegnes den åbne læseramme (eng. Open Reading Frame, ORF) og er den del der kan kode for et protein. Det er dog ikke alle åbne læserammer der koder for et funktionelt protein, faktisk er det som regel kun en åben læseramme ud af de 6 mulige der gør det. DNA'sekvensen i den åbne læseramme der koder for det funktionelle protein kaldes den kodende sekvens (eng. coding sequence, CDS, se infoboks 4), og er dermed det stykke DNA der translateres til proteinet. Du kan læse mere om det centrale dogme og translation her. Infoboks 4 CDS er en forkortelse for coding sequence og er den del på DNAsekvensen der koder for selve proteinet. En DNA sekvens består nemlig af introns og exons, hvor exons er de dele af DNA-sekvensen der splejses sammen til et messenger RNA der senere translateres til et protein.

8 Fylogeni I programmet FigTree kan man visualisere evolutionære træer. Kendskab til fylogeni og trækonstruktion er derfor vigtigt for at kunne bruge programmet og fortolke resultatet. Fylogeni er læren om og beskrivelsen af organismers slægtskab, se infoboks 1. Fylogeni bruges blandt andet til: I. Klassificering af fossiler og levende arter så de kan blive placeret i livets træ sammen med andre kendte organismer. II. Kortlægge konserverede domæner (se infoboks 2) i f.eks. vira og bakterier for at finde sekvenser til brug i vacciner. Du kan læse mere om konserverede domæner her. III. Finde sammenhæng mellem kendte og nyopdagede proteiner for at bestemme de nyes funktionalitet. I fylogenetiske træer bliver arter og organismerne betegnet som taxons (flertal: taxa, se infoboks 3), og træets tippe har hver én taxon, se figur 1. Hvis man følger en taxon tilbage, ned langs grenene, er hver forgrening ensbetydende med en fælles stamfader. Med andre ord, er forgreningspunktet det sted hvor en taxon udviklede sig til to taxa. Disse to taxa har hver en gren ud fra forgreningspunktet, og de betegnes derfor som søstergrupper. I figur 1 er taxa A og B søstergrupper, da de begge stammer fra stamfader III, Alle taxa, der er udviklet fra en fælles stamfader kaldes en monofyletisk gruppe (eng. clade). I figur 1, hører taxa A, B, C og stamfader III til samme monofyletiske gruppe, da de alle udspringer fra stamfader II. Monofyletiske grupper dannes, da medlemmerne i de forskellige grupper vil have en række karakteristika tilfælles, hvilke de alle har arvet fra deres fælles stamfader. Infoboks 1 Fylogeni er læren om organismers slægtskab. Et fylogenetisk træ er således et stamtræ hvor man kan visualisere organismernes evolutionære slægtskab Infoboks 2 Konserverede domæner er specifkke områder af en eller flere aminosyrers længde i et protein som IKKE er muteret mellem forskellige organismer. Konserverede domæner er ofte det sted på proteinet der udfører den biologiske funktion proteinet har. Hvis to proteiner har de samme konserverede domæner kan det antages at de udfører samme funktion og dermed er beslægtede. Klik her for et eksempel på konserverede domæner. Infoboks 3 Taxon er betegnelsen for en organisme i et fylogenetisk træ. Flere organismer betegnes taxa, og et fylogenetisk træ viser dermed det evolutionære slægtskab mellem træet taxa.

9 Figur 1. Eksempel på et fylogenetisk træ med taxa, stamfædre og grupperinger. Et fylogenetisk træ kan både være rodet eller ikke-rodet. Når der her skrives rodet er det ikke ensbetydende med uorden, men derimod et udtryk for en kronologisk udvikling af træets taxa. Et ikke-rodet træ viser hvorledes træets taxa er beslægtet med hinanden, men giver ikke noget billede af udvikling i forhold til hvilke taxa der ældst/yngst. Et ikke-rodet træ benyttes derfor hvis udviklingen er underordnet og man blot ønsker at se, hvorledes træets taxa er grupperet. Et rodet træ har derimod en rod svarende til den ældste fælles stamfader, hvorfra træets taxa har udviklet sig. For at kunne lave et rodet træ er man nødt til at have et vist kendskab til træets taxa. Man kan benytte en såkaldt ydergruppe (eng. outgroup, se infoboks 4) til at placere roden på et træ, da ydergruppen er den taxon der først er divergeret væk fra træets andre taxa (eng. ingroup). For at være i stand til at lave et rodet træ er det derfor en god ide at inkludere en taxon som på forhånd vides at være divergeret væk fra de andre først, dvs. ligge evolutionært langt væk fra de resterende taxa. Ønsker man eksempelvis at undersøge slægtskabet mellem pattedyr kan man for hver art tage en sekvens der koder for det samme protein samt inkludere den samme sekvens fra en fugl, da det på forhånd vides at fugle ikke er evolutionært beslægtet med pattedyr på samme måde som de er indbyrdes. Fugle-sekvensen kan således benyttes som ydergruppe og dermed lave et rodet træ så det kronologisk slægtskabstræ for pattedyrerne kan visualiseres. Et eksempel på et ikke-rodet og et rodet træ kan ses i figur 2. Begge træer viser det samme slægtsskab, men i træ B er taxon A valgt som ydergruppe og træet er derfor blevet rodet. Hver gren i træet har en distance tilknyttet, hvilken eksempelvis kan være antal mutationer. Ved at sammenligne træet i A og B ses det, at distancerne ikke er ændret, hvilket betyder at det indbyrdes slægtsskab ikke er ændret, Infoboks 4 En ydergruppe betegner den taxon som er mindst belægtet med alle de andre taxa i det slægtskab man undersøger. Ydergruppen skal specificeres hvis man vil lave et rodet træ og

10 men blot den grafiske afbildning. Figur 2. Forskel mellem et rodet og ikke rodet træ. A viser et fylogenetisk træ der ikke er rodet. B viser et fylogenetisk træ som er blevet rodet ved at bruge taxon A som ydergruppe. Det ses, at grenlængderne ikke er ændret så slægtsskabet mellem træets taxa er dermed ikke ændret. Det rodede træ vil derfor "kun" give en kronologisk opbygning af slægsskabet og ikke ændre det. Klik for at se figuren i stor format. Hvis man ønsker at læse mere om fylogeni og evolutions teori kan følgende læses: Gyldendals Store Danske Encyklopædi om Evolution: Gå til siden Gyldendals Store Danske Encyklopædi om Fylogeni: Gå til siden Engelsk introduktion til emnet udarbejdet af Center for Biologisk Sekvensanalyse på DTU: Download

11 Proteinstruktur Proteiner er en polypeptider (poly = mange), som er sammensat afaminosyrer, der er kovalent sammenbundet gennem peptidbindinger (se infoboks 1). Aminosyrer Den generelle struktur for en aminosyre kan ses i figur 1. Infoboks 1 En kovalent binding er betegnelsen for en stærk binding mellem to atomer. Figur 1. Den generelle struktur af en aminosyre. Den består af et kulstof atom bundet til en positivt ladet aminogruppe, en negativt ladet carboxylgruppe, et hydrogen atom og en sidekæde. Der findes i alt 20 forskellige aminosyrer, der hver er karakteriseret på baggrund af deres sidekæde. Sidekæden definere hvilke kemiske egenskaber aminosyren har og dermed hvilke bindinger den kan lave. De 20 aminosyrer er inddelt i 5 kategorier på baggrund af deres kemiske egenskaber. Aminosyrer opdelingen kan ses i tabel 1.

12 Tabel 1. Oversigt over de 20 forskellige aminosyrer, opdelt efter kemiske egenskaber. Primærstruktur Aminosyrer bliver sat sammen gennem peptidbindinger, hvormed lange rækker af aminosyrer kan dannes, disse kaldes som før nævnt polypeptider. Peptidbindingen bliver dannet ved at det negativt ladet oxygen i carboxylgruppen reagerer med et af hydrogen atomerne fra aminogruppen i en anden aminosyre. Ved reaktionen bliver der afgivet et vandmolekyle (betegnes kondensation), og en peptidbinding er dermed skabt, se figur 2.

13 Figur 2. Dannelsen af peptidbindinger. Det ses, at der frigives et vandmolekyle for hver binding der dannes. Rækkefølgen af aminosyrer betegnes et proteins primærstruktur. Polypeptider vil altid have to ender; en med en fri aminogruppe og en med en fri carboxylgruppe. Den ende i kæden der har en fri aminogruppe betegnes N terminalen og den ende der har en fri carboxylgruppe betegnes C terminalen. Sekundærstruktur De lange polypeptidkæder kan på grund af sidekædernes kemiske egenskaber foldes i lokale rumlige strukturer. De mest udbredte strukturer kaldes α-helix og β-plader. α-helixen er en spiral med en rygrad af aminosyrer, der er holdt sammen ved hydrogenbindinger mellem hver femte aminosyre. Spiralen er konstrueret sådan, at aminosyrernes sidekæder stikker ud af spiralen. Sidekæderne kan interagere med hinanden for at skabe stabilitet til spiralen, men de kan også interagere med andre molekyler, se figur 3. α-helixer er mest udbredt i membranproteiner (proteiner der går gennem cellemembranen) og i DNA bindende proteiner. I DNA bindende proteiner er α-helixen i de domæner der interagerer med DNA'et så proteinet kan ændre på transkriptionen af DNA'et.

14 Figur 3. α-helix med sidekæder, hvor hydrogenbindinger er vist med gule prikkede linjer. β-plader består af to eller flere β-strenge. β-strengene kaldes for β- plader backbone (rygrad) og er peptidekæder der er sat sammen med hydrogenbindinger (se infoboks 2) mellem hver backbone. β- pladernes struktur bevirker, at sidekæderne stikker vinkelret ud fra pladerne med en variation på hver anden, således at den første sidekæde stikker op ad, den anden stikker ned ad osv., se figur 4. β- plader bruges bl.a. til danne strukturer der går gennem cellemembranen således at små molekyler kan transporteres ind og ud af cellen. Infoboks 2 En hydrogen binding er en svag binding mellem to atomer, der deler et hydrogen atom. Figur 4. β-plade vis med sidekæder. Det kan ses, at sidekæderne er vertikale på pladen hvor hver anden stikker henholdsvis op og ned. Tertiærstruktur Polypeptidkæden er en dynamisk struktur som på grund af de mange forskellige sidekæder kan foldes i forskellige strukturer. Disse strukturer danner proteints tertiærstruktur, hvilken bliver ofte stabiliseret af α-helix, β-plader, svovlbroer mellem aminosyren cystein's sidekæder samt hydrofobe/-file interaktioner. Proteiners tertiærstruktur bestemmer deres funktion. Foldningen bevirker nemlig,

15 at aminosyrerne bliver placeret så de kan interagere i specifikke processer, f.eks. til at katalysere enzymatiske reaktioner. Proteiner kan være opdelt i såkaldte domæner der hvert tildels folder uafhængigt af de andre. Hvert domæne vil have en unik struktur og dermed forskellige egenskaber. Se figur 5 for et eksempel på en tertiærstruktur og figur 6 for en sammehæng mellem den primær-, sekundær- og tertiærstruktur. Figur 5. Eksempel på et proteins tertiærstruktur. Her kan både β-plader og α-helix ses. Figur 6. Sammenhæng mellem den primær-, sekundærog tertiærstruktur. β-plader er vist med gule pile og α-helix er vist med røde spiraler. Kvaternærstruktur De foldede polypeptidkæder kan interagere med hinanden og danne

16 et protein kompleks. Komplekset er proteinets kvaternærstruktur, og polypeptidkæderne betegnes som subunits i det færdige protein. Et protein kompleks kan består af mange subunits, der både kan være forskellige og ens. Eksempelvis består et hæmoglobin molekyle af fire identiske subunits, der hver kan binde et oxygen molekyle. Se figur 7 for et proteins kvaternærstruktur. Figur 7. Eksempel på et proteins kvatærstruktur. Her er hæmoglobin vist og de fire forskellige subunit kan ses med hver sin farve. Strukturen er fundet gennem PDB og lavet i PyMol. Konserverede domæner Som nævnt ovenfor bliver polypeptidkæderne foldet til tertiærtrukturer, som har en specifik biologisk egenskab. En biologisk egenskab er f.eks. regulering af transkription (når et protein binder til DNA'et) eller nedbrydelse af sukkermolekyler i fordøjelsessystemet. Selvom det er hele proteinet der har en biologisk egenskab er det faktisk kun bestemte aminosyrer eller længere peptidsekvenser i proteinet der er direkte forbundet med funktionen. Den funktionelle del af proteinet er ofte konserveret (bevaret), dvs. aminosyresammensætning der er karakteristisk for en funktion vil kunne findes på tværs af forskellige organismer, der ellers er fjernt beslægtede. De aminosyrer der ikke udgør den funktionelle del er ikke så vigtige for proteinets funktion, men kan i stedet medvirke til at stabilisere protienstrukturen og foldningen. Da aminosyrerne ikke indgår direkte i de biologiske funktioner, vil aminosyrerne til en vis grad kunne ændres eller fjernes uden proteinet mister sin biologiske egenskab. Figur 8 illustrerer hvor konserverede domæner kan være. Her er de konserverede domænerne i α-helixen og β-pladen (indikeret med en grå streg), mens de aminosyrer der er i loopet før, efter og i mellem dem er ændret. Ændringerne har ikke betydning for sekundærstrukturen og det er dermed den samme tertiærstruktur der vil dannes fra begge sekvenser.

17 Figur 8. To sekvenser har konserverede domæner der hvor de danner en α- helix og en β-plade. Selvom den primærstruktur ikke er helt identisk mellem de to sekvenser, vil de alligevel have den sammen tertiærstruktur og dermed samme funktion. Når man laver alignemnts vil man ofte kunne se konserverede domæner, dvs. aminosyrerne på disse positioner vil være identiske i de sekvenser der sammenlignes. Endvidere vil aminosyrerne uden for domænet i højere grad variere, men ofte vil aminosyrerne være indenfor samme kemiske gruppe som klassificeret i tabel 1. Når aminosyrerne er indenfor samme gruppe vil de nemlig have den samme kemiske egenskab og dermed bibeholde proteinet i en korrekt struktur.

18 Sekvens alignment Sekvens alignments (se infoboks 1) benyttes til at sammenligne to eller flere DNA- eller proteinsekvenser. Programmet BLAST benytter alignments til at finde sekvenser der er beslægtede med den sekvens der benyttes til BLAST. Hvis man kender sammensætningen af nukleotid eller aminosyrer for henholdsvis DNA- eller proteinsekvenser kan man sammenligne to eller flere sekvenser for at se hvor meget de ligner hinanden. Sammenligningen af sekvenser foretages DNA mod DNA og protein mod protein, da man ser direkte på hvilke nukelotider eller aminosyrer som er identiske mellem sekvenserne. På engelsk betegnes sekvenssammenligninger som alignments og at sammenligne sekvenser betegnes at aligne to sekvenser. Termerne alignment og aligne vil blive brugt i denne teoridel. Alignments foretages for at se om to sekvenser er beslægtede. Hvis sekvenserne er beslægtede er der en sandsynlighed for at proteinerne har samme funktion og gennem alignments kan man således finde funktionen af ukendte sekvenser. På grund af mutationer i form af insættelser (eng. insertions) eller fjernelser (eng. deletions) af aminosyrer kan beslægtede sekvenserne været blevet ændret med tiden, og aminosyrerne kan derfor variere eller hele dele af sekvensen kan være fjernet (se infoboks 2). På trods af ændringer i sekvensen kan den overordnede funktion stadig været bevaret, da det er specifikke domæner (f.eks. katalyserende domæner i enzymer, se infoboks 3) der har betydning for proteints funktion. Således gør det intet at mindre betydningsfulde positioner i proteinet er muteret. På grund af indsættelser eller fjernelser af aminosyrer er de sekvenser man aligner ikke altid lige lange. For at tage højde for det i alignmentet kan man indsætte huller (eng. gaps, se infoboks 4) for at indikere at en eller flere aminosyrer mangler. Ved at indsætte huller kan man opnå en bedre alignment, hvilket fremgår af figur 1. Infoboks 1 Når man lave en alignment vil det sige at man sammenligner DNA- eller proteinsekvener for at undersøger om der er steder på sekvensen hvor de er ens. Hvis sekvenserne er ens kan det antages at proteinerne har samme funktion. Infoboks 2 Mutationer kan opstå på forskellige måder; de kan være inducerede af f.eks. radioaktivitet eller forekomme naturligt som en del af evolutionen. Mutationer overordnet opdeles i t0 kategorier: 1. punktmutation, hvor en enkelt nukleotid er ændret f.eks. fra A til G. 2. Frame-shift mutationer, hvor der er enten er fjernet eller indsat en eller flere nukleotider..

19 Infoboks 3 Figur 1. To sekvenssammenlignerne. Den øverste er uden huller og den nederste med. Et 1 tal indikerer at aminosyrerne er identiske og et 0 indikerer at der er enten et mis-match eller et hul. I teorien kan alle sekvenser alignes, og hvis man indsætter tilstrækkelig mange huller vil sekvenserne blive lige lange. For at skelne mellem gode og dårlige alignments, dvs. alignments hvor proteinerne faktisk er beslægtede mod alignments hvor de ikke er, benytter man et scoringssystem. Scoringssystemet er konstrueret således, at hver alignment får tildelt en score (alignment scoren), som på baggrund af antal identiske aminosyre (match), antal huller og antal næsten identiske aminosyre (mis-match, f.eks. position 6, L mod V, i figur 1) tildeler alignmentet en score. Des højere score vil være ensbetydende med en bedre sammenligning, da match vil bevirke til en positiv score og huller/mis-match vil få tildelt en negativ score. Hvis det antages at et match scorer 1, mis-match scorer -1 og huller scorer -2 vil scoren for de to alignments i figur 1 være: Sammenligning uden huller: = -4 Sammenligning med huller: = 3 Det kan således ses, at selvom der bliver indsat huller der vægter negativt vil alignmentet alligevel være bedre end uden huller. Omvendt ville et overtal af huller dominere med en negativ score, og dermed vil en alignment med mange huller ikke være favorabel. Som nævnt kan man lave alignments mellem to eller flere sekvenser. Hvis man aligner mere end to sekvenser kaldes det et multiple alignment. Når man laver multiple alignments kan man undersøge hvor tæt beslægtede et stort antal proteiner er. Man kan bruge disse alignments til at lave fylogenetiske træer (se infoboks 5), således at slægtskabet mellem proteinerne kan visualiseres. Du kan læse mere om fylogeni her. Nogle proteiner er mere identiske på tværs af arter end andre. Ofte er disse proteiner essentielle proteiner, hvilke indgår i vigtige biologiske processer som metabolismen, proteinsyntesen og DNA-replikation. Specifikke domæner i proteiner er her ensbetydende med områder i proteinet der er vigtigt for dets funktion. Disse domæner er oftest bevarede i beslægtede proteiner og aminosyrer sekvensen vil derfor være identisk på disse steder når man sammenligner sekvenserne. Specifikke domæner er f.eks. steder hvor proteinet interagerer med andre proteiner eller molekyler, eller det sted hvor processer katalyseres. Se et eksempel på specifikke (bevarede) domæner her. Infoboks 4 Huller (gaps) kan observeres i sekvenssammenligning er, og er er de steder hvor en deletion eller insertion har fundet sted i en af sekvenserne. En deletion er ensbetydende med at en eller flere nukleotider eller aminosyre er blevet slettet. Huller kan ses som "-" i den sekvens der mangler de pågældende nukleotider/aminosyrer.

20 Det skal dog påpeges at bevarede proteiner ikke altid er essentielle, men det kan antages at hvis bestemte områder i et protein er bevaret er disse essentielle. Ved at lave multiple allignments på essentielle proteiner der stammer fra forskellige organismer vil man udover at se slægtskabet over proteinerne også kunne se slægtskabet mellem organismerne, da det kan antages, at forskellen mellem proteinerne relativt set er den samme som forskellen mellem organismerne. Således kan man bruge alignments til at undersøge hvor beslægtede både proteiner og organismer er. Infoboks 5 Fylogeni er læren om organismers slægtskab. Et fylogenetisk træ er således et slægtskabsstæ hvor man kan visualisere organismernes slægtskab.

21 Portefølje i bioinformatik øvelser Porteføljen består af en beskrivelse samt generel guide til syv forskellige programmer og databaser samt 4 tilhørende øvelser der hver berør flere af de beskrevne programmer. De fire øvelser er alle uafhængig af hinanden og består hver af en række deløvelser der eksemplificere brugen af netop et program eller database. De fire øvelser er alle bygget op med en kronologisk tilgang til brugen af de forskellige programmer og databaser, men alle deløvelserne vil også kunne laves separat hvis dette skulle ønskes. Oversigt over programmer og databaser: Basic Local Alignment Search Tool (BLAST) FigTree National Center for Biotechnology Information (NCBI) Protein Databank (PDB) PyMol UniProt Virtual Ribosome Oversigt over øvelser: 1. Aktin, fra mrna til tredimensionelt protein Denne øvelse arbejder med Virtual Ribosome, UniProt, PDB og Pymol. 2. Myostatins proteininteraktioner og organismers slægtsskab Denne øvelse arbejder med UniProt, PDB, Pymol og FigTree. 3. Bioinformatisk analyse af antistoffer Denne øvelse arbejder med BLAST, PDB og Pymol. 4. Identifikation og visualisering af ukendt protein Denne øvelse arbejder med BLAST, UniProt, PDB og Pymol.

22 Programmer og Databaser Basic Local Alignment Search Tool (BLAST) Gå til BLAST her. Basic Local Alignment Search Tool (BLAST) er en metode til at sammenligne DNA- eller proteinsekvenser. Figur 1. Illustration på BLAST. Ved at blaste en sekvens mod en database laver man en parvis alignment mellem query-sekvensen og alle andre sekvenser i den pågældende database. Hver alignment får en score og tilslut kan man se om der er nogle sekvenser i databasen der er beslægtede med query-sekvensen. Beskrivelse BLAST er et værktøj, der bruges til at sammenligne DNA- eller proteinsekvenser. Når man bruger BLAST laver man database søgning, da man undersøger om der i en database findes DNA- eller proteinsekvenser der ligner den input sekvens man har givet BLAST. Den sekvens man undersøger betegnes en query-sekvens (se infoboks 1) og undersøgelse i BLAST betegnes at blaste sekvensen (se infoboks 2). Disse to termer vil gå igen i materialet og det er derfor vigtigt at blive bekendt med dem. BLAST kan også bruges til at finde funktionen af DNA- og proteinsekvenser. Det kan nemlig antages at hvis to sekvenser ligner hinanden i aminosyresammensætning har de også samme funktion. Overordnet set er BLAST et værktøj, der giver et hurtigt overblik over Infoboks 1 En query sekvens er betegnelsen for den DNA- eller proteinsekvens man laver en BLAST på. Infoboks 2 At lave en BLAST undersøgelse på en given DNA- eller proteinsekvens betges at blaste sekvensen. I. Hvorvidt en query-sekvens er beslægtet med andre sekvenser i en database. II. I hvor høj grad sekvenserne er relaterede. III. Hvad funktionen af query-sekvensen højst sandsynlig er. BLAST er bygget på en matematisk model der sammenligner DNAeller proteinsekvenser ved brug af parvis alignment. Parvis alignment er en metode til at søge efter lokale ligheder (eng. local alignments,

23 se infoboks 3) mellem query-sekvensen og de DNA- og proteinsekvenser der findes i de biologiske databaser. En alignmentet er illustreret ved figur 2. Man kan udregne en score for hvor godt alignmentet er ved at finde de positioner hvor sekvenserne er henholdsvis forskellige og identiske. På baggrund af scoren kan man konkludere hvor tæt sekvenserne er beslægtede. Du kan læse mere om alignments her. Infoboks 3 Når man lave en alignment vil det sige at man sammenligner DNA- eller proteinsekvener for at undersøger om der er steder på sekvensen hvor de er ens. Hvis sekvenserne er ens kan det antages at proteinerne har samme funktion. Figur 2. Sammenligning af to proteinsekvenser. Et grønt 1-tal indikerer at de to aminosyre er identiske og et rødt 0 indikerer at de er forskellige. Til at udregne scoren bliver identiske aminosyrer scoret med værdien 1 og to forskellige aminosyrer bliver scoret med værdien -1. BLAST sorterer søgeresultaterne efter hvor godt de matcher querysekvensen. Resultatsekvenserne sorteres efter den før omtalte score, hvor en høj score er ensbetydende med et godt match og dermed en indikation af at sekvenserne er beslægtede. De sekvenser der alignes er ikke altid lige lange. På grund af mutationer i DNA kan der være fjernet eller indsat nukleotider i DNAsekvensen, hvilket betyder at der mangler eller er blevet indsat en ekstra aminosyre. Der tages højde for mutationer i alignmentet, da man kan indsætte huller (eng. gaps, se infoboks 4) i alignmentet for at få en bedre score og dermed en bedre sammenligning. Figur 3 viser hvordan indsættelse af huller kan forbedre scoren. For at hele alignmentet ikke bliver fyldt med huller, bliver disse scoret med en negativ værdi som er lavere end den for to forskellige aminosyre der står overfor hinanden. I figur 3 bliver match scoret med 1, et mismatch (to forskellige aminosyrer) bliver scoret med -1 og huller bliver scoret med -2. Du kan læse mere om brugen af huller i sekvenssammenligninger her. Infoboks 4 Huller(gaps) kan observeres i sekvenssammenligning er, og er er de steder hvor en deletion eller insertion har fundet sted i en af sekvenserne. En deletion er ensbetydende med at en eller flere nukleotider eller aminosyrer er blevet slettet. Huller kan ses som "-" i den sekvens der mangler de pågældende nukleotider/aminosyrer.

24 Figur 3. Sammenligning af to proteinsekvenser hvor der er indsat huller. Et grønt 1-tal indikerer at de to aminosyrer er identiske og et rødt 0 indikerer at de er forskellige. Til at udregne scoren bliver identiske aminosyrer scoret med værdien 1, to forskellige aminosyrer bliver scoret -1 og et hul bliver scoret med -2. Hvis der sammenlignes med alignmentet fra figur 2 er det tydligt at sekvenserne matcher bedre efter der er indsat huller. Når man laver en BLAST undersøger man om en query-sekvens er beslægtet med andre proteiner i en database. Når man skal analysere resultaterne fundet gennem BLAST er det derfor vigtigt at være kritisk, da man vil finde beslægtede sekvenser. I teorien kan ALLE sekvenser nemlig alignes, men blot fordi de kan det, eller får en høj score er det ikke nødvendigvis ensbetydende med at resultatsekvensen er beslægtet med query-sekvensen. I BLAST resultatet er der inkluderet metoder der undersøger om sekvenserne i alignmentet kan karakteriseres som værende beslægtet. Dette gøres blandt andet ved at finde resultatsekvensernes querydækning og e-værdi. Nedenfor gennemgås de tre forskellige værdier som der er vigtige at kigge på når man fortolker et BLAST resultat. Query dækning (eng. query coverage) angiver hvor mange procent af den pågældende resultatsekvens der er med i den parvise alignement den danner med query-sekvensen. Hvis query dækningen er på høj indikerer det, at en stor andel af resultatsekvensen matcher query sekvensen. Det skal dog påpeges, at dækning ikke fortæller om der er eventuelle huller i alignmentet (se infoboks 4) eller om alle aminosyrerne er identiske. Desuden kan den procentuelle dækning være misvisende da en query-sekvens kan være en lille del af en større sekvens og den procentuelle dækning vil således ende med at være lille da den kun angiver den del af resultatsekvensen der indgår i den parvise alignment med query-sekvvensen. Max scoren er den score som hver resultatsekvens får på baggrund af matchet med query-sekvensen. Max scoren udregnes gennem den før omtalte matematiske model og tager ikke højde for om sekvenserne egentlig er identiske. Query-sekvensen bliver nemlig sammenlignet med ALLE sekvenser i den pågældende database, og hver sammenligning vil få tildelt en score. I et

25 generelt BLAST-output er det resultatsekvenserne med de højeste scorer, der bliver vist først (des højere score, des bedre match), men som nævnt er en høj score ikke ensbetydende med et identisk match. Grunden er, at sekvenser rent tilfældigt kan matche en query-sekvens uden egentlig at være beslægtet med den. Et mål for tilfædigheden er e-værdien, hvilke beskrives nedenfor. E-værdien (eng. e-value eller expected valuee ) angiver den forventede (tilfældige) tilstedeværelse af en resultatsekvens i den database man søgte imod. Grunden til man bruger e-værdier er, at man af tilfædlige årsager kan finde højt scorende resultatsekvenser i en stor database. E-værdien for en given sekvens bruges til at sige hvor mange resultater med den score man ville kunne forvente af tilfældige årsager. Input: En query sekvens (DNA- eller proteinsekvens). Output: Liste over resultatsekvenser der matcher querysekvensen. Generel guide Når man skal foretage en BLAST skal følgende punkter gennemgåes: 1. Valg af den organisme og/eller database man vil søge mod. 2. Valg af BLAST typen. 3. Indtaste sekvens eller uploade fil med sekvens. 4. Starte BLAST 5. Fortolke resultatet De 5 punkter vil blive gennemgået nedenfor. Punkt 1-2 På startsiden for BLAST, se figur 4, kan man vælge hvilken organisme man ønsker at blaste query-sekvensen mod. Man vælger organismen under BLAST Assembled RefSeq Genomes. Hvis der ikke er noget specifikt ønske om organisme kan man blaste mod alle sekvenser i databasen ved at vælge Basic BLAST. Det skal påpeges at typen af BLAST (BLAST mod DNA- eller proteinsekvenser) også kan vælges når man har indtastet sin query sekvens, se figur 5.

26 Figur 4. BLAST start side. Figur 5. BLAST søgeside. Punkt 3 Afhængig af den query-sekvens man ønsker at blaste, og om man vil finde lignende DNA- eller proteinsekvenser, skal BLASTen specificeres. Dette gøres ved at vælge hvilken type BLAST man vil foretage. Der er følgende former: BLASTn: Har en nukleotidsekvens og søger i nukleotiddatabaser. BLASTp: Har en proteinsekvens og søger i proteindatabaser. BLASTx: Har en nukleotidsekvens og søger i proteindatabaser. tblastn: Har en proteinsekvens og søger i nukleotiddatabaser. tblastx: Har en nukleotidsekvens og søger i nukleotiddatabaser (denne er mere omfattende end BLASTn). De type af BLAST, der er mest benyttede er BLASTn og BLASTp. Øvelserne der omhandler BLAST arbejder med BLASTp.

27 I figur 5 kan søgesiden for BLAST ses. Den øverste markering viser felterne, der specificerer hvilken type BLAST man vil lave og den midterste markering viser hvor man kan vælge hvilken database man vil blaste imod. De mest benyttede databaser er dem der indeholder flest sekvenser. Disse er følgende: nucleotide collection nr/nt for BLASTn, tblastn og tblastx. non-redundant protein sequences for BLASTp og BLASTx. Man kan begrænse sin søgning ved at vælge databaser, der indeholder et begrænset antal sekvenser. Eksempelvis benyttes databasen Protein Data Bank (PDB, læs mere her), hvis man kun ønsker resultater hvor proteinet har en kendt 3D struktur. Punkt 4 Den nederste markering i figur 5 viser hvor man starter BLAST. Punkt 5 Outputtet af BLAST er opdelt i tre dele; Graphic Summary, Descriptions og Alignments. De to første dele kan ses i figur 6 og den sidste i figur 7. De vigtigste områder er forklaret på illustrationen og vil blive gennemgået nedenfor. Infoboks 5 En superfamilie er den overordende betegnelse for protienfamilier, der er grupper af proteiner der nedstammer fra en fælles stamfader og som typisk har ens tredimensionel struktur. Infoboks 6 Figur 6. Den øverste del af BLAST outputtet. GraphicSummary Øverst kan man se hele query-sekvensen og dens længde i aminosyrer (sekvensen i figur 4 er 136 AA lang). Under query-sekvensen er området superfamilier (eng. superfamilies, se infoboks 5). Her angives hvor på querysekvensen der er konserverede domæner (se infoboks 6), og om disse tilhører en bestemt superfamilie af proteiner. Du kan læse om konserverede domæner her. I den næste del af graphic summary kan man se hvilke områder af resultatsekvenserne, der match query-sekvensen samt hvor de Konserverede domæner er specifkke områder af en eller flere aminosyrers længde i et protein som IKKE er muteret mellem forskellige organismer. Konserverede domæner er ofte det sted på proteinet der udfører den biologiske funktion proteinet har. Hvis to proteiner har de samme konserverede domæner kan det antages at de udfører samme funktion og dermed er beslægtede. Klik her for et eksempel på konserverede domæner.

28 matchende områder er. Hver linje er en resultatsekvens, og de er listet i den rækkefølge som sekvenserne også er listet i Descriptions delen. Farverne for hver resultatsekvens (sort, blå, grøn lilla og rød) indikerer hvad max-scoren for resultatsekvensen er, og længden af linjerne indikerer hvilke områder i sekvensen query- og resultatsekvensen er identiske. Descriptions Her er de bedste resultatsekvenser vist med accession nummer, beskrivelse af proteinfunktion, hvor det stammer fra, max scoren, total scoren, procent lighed, e-værdi og links til databaser hvor sekvensen kan findes. Ved at trykke på accession nummeret kan man komme til proteinets genbankside hvor man kan finde flere informationer omkring proteinet (se infoboks 7 for information og se opbygningen af en genbankside her). De vigtigste informationer omkring resultatsekvensen og matchet med query-sekvensen kan findes ved at se på e-værdien, max scoren og procent ligheden, da disse tre beskriver hvor identisk resultatsekvenserne er med query-sekvensen. En resultatsekvens kan antages som et korrekt match til querysekvensen hvis e-værdien er under 10ˆ-4-10ˆ-5 (des lavere, des bedre). Infoboks 7 Genbank er hoved databasen for DNA sekvenser, og indeholder dermed flest sekvenser. En sekvens genbank side er en internet side i Genbank der indeholder informationer om netop den DNA-sekvens. Figur 7. Den nederste del af BLAST outputtet. Alignments Her vises sekvenssammenligningen mellem de enkelte resultatsekvenser og query-sekvensen. I hver sekvenssammenlignen vises hvilke steder sekvenserne er både identiske og forskellige. Den midterste sekvens er sammenligningen, hvor en aminosyre indikerer at aminosyreren på den position er identiske, et "+" indikerer at aminosyrerne minder om hinanden fysisk/kemisk, f.eks. hvis de begge har carboxylsyre sidekæder, og et mellemrum indikerer at sekvenserne er vidt forskellige på den position. Det anbefales altid at kigge på sekvenssammeligningerne, da man således kan se hvor sekvenserne er identiske. En resultatsekvens

29 kan endvidere undersøges nærmere ved at trykke på accession nummeret, hvilke vil føre til dens beskrivelse på NCBI. På baggrund af viden omkring en god e-værdi samt sammenligning af max score og procentuel lighed, kan det bestemmes hvilken/hvilke resultatsekvenser der matcher query-sekvensen. Hvis man opnår resultater med en e-værdier der er laver en grænseværdien på 10ˆ-4-10ˆ-5 kan man konkludere at query sekvensen har samme funktion som resultatsekvensen med den lave e-værdi. Alle resultatsekvenser vil altid kunne undersøges nærmere ved at trykke på det tilhørende accession nummer hvormed man kan gå til dens genbank- eller NCBIside. Øvelse 3. Bioinformatisk analyse af antistoffer (3.A) og øvelse 4. Identifikation og visualisering af ukendt protein (4.A) arbejder med brugen af BLAST.

30 FigTree FigTree kan hentes her. FigTree er et program der benyttes til at visualisere fylogenetiske træer så man blandt andet kan danne sig et overblik over organismers slægtskab. Figur 1. Fylogenetisk træ. Et fylogenetisk træ viser slægtsskabet mellem forskellige taxa (arter). For at kunne fortolke resultatet af FigTree er det vigtigt at have en basis forståelse af fylogeni og evolutionære slægtskaber (se infoboks 1). Det anbefales derfor at læse teori afsnittet om fylogeni. Du kan finde teorien her. Beskrivelse FigTree bruges til at visualisere slægtskaber mellem organismer gennem fylogenetiske træer. Fylogenetiske træer kan konstrueres på forskellige måder. Hver måde benytter en bestemt matematisk model, og valg af denne vil bestemme hvordan slægtskabet mellem organismer bliver. Oftest er der ikke variation i det over ordnede slægtskab, men det er vigtigt at vide, at et evolutionært slægtskab ikke altid er entydigt. I øvelserne er valg af matematisk model er underordnet da FigTree bruges til at visualisere træer der er lavet på forhånd. Infoboks 1 Fylogeni er læren om organismers slægtskab. Et fylogenetisk træ er således et stamtræ hvor man kan visualisere organismernes evolutionære slægtskab Input: Fil med det fylogenetisk træ i format phylip (filen kan kan laves i programmet ClustalX eller Treehugger, hvor bl.a. sekvenssammenligninger bruges til lave træer. Dette ligger dog uden for det her materiale). Output: Et fylogenetisk træ hvor man kan visualisere slægtskabet mellem organismerne. Generel guide

31 Inden man kan benytte FigTree skal man have lavet et træ og gemt det i phylip format. Et træ kan laves med programmerne ClustalX eller Treehugger, men i øvelserne der arbejder med FigTree får du træer der lavet på forhånd og du skal derfor ikke selv konstruere dem. I et åbnet FigTree vindue benyttes open til at åbne phylip filen med det træ man vil visualisere. Træet der vises har en rod, dvs. den ældste stamfader er fordefineret. Roden er dog valgt tilfældigt af FigTree og giver derfor ikke et korrekte billede af det kronologiske slægtskab. For at få et rigtigt billede af slægtskabet bør træet vises uden rod. Et ikke-rodet træ viser nemlig hvordan træets taxa er relateret til hinanden, men giver ingen indikation om kronologien i slægtskabet, dvs. træet giver ikke nogen informationer om hvilke taxa der er ældst eller yngst. I figur 2 kan det ses hvordan man viser et træ uden rod. For at lave træet med en korrekt rod skal man have kendskab til de forskellige taxa i træet og vide hvilken der er fjernest beslægtet. Hvis man ved hvilken taxon der er fjernest beslægtet kan en ydergruppe vælges (se infoboks 2 og læs mere om ydergrupper her), og træet vil kunne rodes i forhold til den. Ved at vælge en ydergruppe specificerer man hvilken taxon der er længst fra de andre, og FigTree vil lave et nyt træ som placerer ydergruppen længst væk fra de andre taxa. Træet omrodes ved først at trykke på den taxon der skal være ydergruppe og derefter benytte kommandoen Reroot, se figur 2. Infoboks 2 En ydergruppe (outgroup) betegner den taxon som er mindst belægtet med alle de andre taxa i det slægtskab man undersøger. Ydergruppen skal specificeres hvis man vil lave et rodet træ og dermed have en kronologisk opbygning af træet, dvs. være i stand til at bestemme hvilke taxon der er yngst og ældst. Figur 2. FigTree output. Klik på figuren for at se den i stor format. Grenene mellem de forskellige taxa i træet svarer til distancen mellem dem og er defineret som antal mutationer divideret med længden af sekvenssammenligningen (alignmentet) inklusiv gaps mellem de to taxa. Det skal påpeges at grenlængden ikke indikerer hvor tæt beslægtet de forskellige taxa er fra hinanden. I figur 3 ses det, at taxon A og B er tættest beslægtet, selvom grenlængden mellem dem (1+2 = 3) er længere end den mellem A og C ( = 2.5). Grunden til dette er, at sekvensen for A er tættere på

32 skevensen for C end den er på B. Dette kan f.eks. skyldes at B har akkumuleret flere mutationer efter den diergerede væk fra A i forhold til antal af mutationer stamfaderen til A og B fik efter C divergerede væk. Målestokken er også vigtig at kigge på, da denne angiver antal mutationer pr. afstand. En høj målestok er således ensbetydende med mange mutationer og dermed stor forskel mellem træets taxa. Grenlængde og målstok er således vigtige for at kunne fortolke slægtskabet korrekt og ikke drage forhastede konklusioner om et eventuelt tæt slægtskab. I figur 2 er det vist hvor man kan finde målestokken i FigTree. Figur 3. Træet viser slægtsskabet mellem taxon A, B og C. På trods af, at grenlængden mellem A og B er større end mellem A og C er A og B faktisk tættere beslægtet, dvs. de to taxa divergerede senere væk fra hinanden. Grunden til at grenlængden mellem A og C er kortere er fordi deres sekvenser er tættere på hinanden end A og B. Dette kan eventuelt skyldes at B har muteret mere siden den divergerede fra A. Øvelse 2. Myostatins proteininteraktioner og organismers slægtsskab (2.D) arbejder med brugen af FigTree.

33 National Center for Biotechnology Information (NCBI) og Genbank Gå til NCBI her. National Center for Biotechnology Information (NCBI) er en af de mest omfattende og benyttede online ressourcer hvor man kan finde information om næsten alle kendte DNA- og proteinsekvenser. Beskrivelse Internetsiden hos NCBI er bygget op omkring mange forskellige databaser, bl.a. sekvensdatabaser for nukleotider og proteiner. Udover sekvensdatabaser, har NCBI også tilknyttet databaser for hele genomprojekter og litteratur (PubMed) samt forskellige programmer som f.eks. søgemaskinen BLAST (læs mere om BLAST her). Det store antal databaser er med til at gøre søgning på NCBI til en af de mest omfangsrige. NCBI er derfor en god internetside at benytte når man skal finde informationer om sekvenser. Brug Finde informationer om DNA- og proteinsekvenser ved at søge på enten navn, funktion, organisme, accession nummer (se infoboks 1) eller lignende. Finde videnskabelige artikler om et givent DNA eller protein. Bestemme en funktion for en ukendt DNA- eller proteinsekvens. Generel guide Ved at benytte NCBI til informationssøgning vil man automatisk søge på tværs af biologisk relaterede databaser. Resultatet af søgningen er omfangsrig på grund af de store databaser, og det er derfor vigtigt at specificere sin søgning. Specificering kan eksempelvis gøres ved at vælge hvilken database man vil søge imod. Valg af database afhænger af om man vil søge efter DNA eller proteiner. I figur 1 kan du se hvor du kan vælge database. Infoboks 1 Et accession nummer er et unikt nummer der gives til DNA- eller proteinsekvens så denne kan findes på tværs af databaser. Dvs. at den samme i UniProt og NCBI eksempelvis vil have samme unikke nummer tilknyttet så man ved at søge på det vil få samme resultat ved søgning i begge databaser. Figur 1. Forsiden på NCBI. Klik for at se figuren i stor format.

34 Søgning på NCBI giver ofte et resultat med mange sekvenser. Hver sekvens der er tilgængelig gennem NCBI har sin egen side med information, en genbankside, se infoboks 2. Man kan gå til en sekvens genbankside ved at klikke på sekvensens understregede navn på resultatsiden, se figur 2. Infoboks 2 Genbank er hoved databasen for DNA sekvenser, og indeholder dermed flest sekvenser. En sekvens genbank side er en internet side i Genbank der indeholder informationer om netop den DNA-sekvens. Figur 2. Siden efter søgning efter protiensekvensen for insulin. Klik for at se figuren i stor format. Genbank Genbank er hoveddatabasen for kendte DNA-sekvenser og den kan findes gennem NCBI's internetside. Hver DNA-sekvens i Genbank har sin egen genbankside. Genbanksiden indeholder informationer omkring DNAsekvensen, bl.a. hele nukleotid sekvensen, organismen den kommer fra, links til dens translaterede proteinsekvensen mm. Genbanksider er alle opbygget på samme måde og består af tre dele hvilke gennemgåes nedenfor. For at se opbygningen af en genbankside kan der klikkes her. Header Denne del indeholder den generelle information omkring sekvensen: Accession nummer, sekvensens navn, hvilken organisme sekvensen stammer fra, hvilket kromosom den er på, hvilke artikler og publikationer der omtaler den mm. Feature Denne del er en slags tabel, der indeholder informationer om selve DNA-sekvensen og funktionen af de forskellige områder i sekvensen. Her beskrives bl.a. hvilke nukleotider der faktisk koder for proteinet (denne del betegnes CDS, der er en forkortelse af coding sequence, se infoboks 3) samt positionerne for introns og exons (se infoboks 3). Origin Denne del indeholder udelukkende selve DNA-sekvensen (nukleotiderne) samt dens positioner. Infoboks 3 CDS er en forkortelse for coding sequence og er den del på DNAsekvensen der koder for selve proteinet. En DNA sekvens består nemlig af introns og exons, hvor introns er de dele af DNA sekvensen der koder for et protein (bliver sat sammen til CDS), og exons bliver splejset ud.

Immunologisk bioinformatik - et undervisningsprojekt til de danske gymnasier

Immunologisk bioinformatik - et undervisningsprojekt til de danske gymnasier Immunologisk bioinformatik - et undervisningsprojekt til de danske gymnasier Isa Kirk Biotech Academy Institut for Systembiologi, Danmarks Tekniske Universitet 2. november 2010 1 Indhold 1 Introduktion

Læs mere

Side 1 af 13. Eksamen: Bioinformatik It og Sundhed 27 Jan 2011 kl 9-13

Side 1 af 13. Eksamen: Bioinformatik It og Sundhed 27 Jan 2011 kl 9-13 Side1af13 Eksamen: Bioinformatik It og Sundhed 27 Jan 2011 kl 9-13 Navn: Studie nummer: Dette eksamenssæt vil også kunne ses som en pdf fil nederst på kursus-hjemmesiden udfor den sidste dag d. 27 Jan

Læs mere

Side 1 af 14. Eksamen: Bioinformatik It og Sundhed 27 Jan 2011 kl 9-13

Side 1 af 14. Eksamen: Bioinformatik It og Sundhed 27 Jan 2011 kl 9-13 Side 1 af 14 Eksamen: Bioinformatik It og Sundhed 27 Jan 2011 kl 9-13 Navn: Studie nummer: Dette eksamenssæt vil også kunne ses som en pdf fil nederst på kursus-hjemmesiden udfor den sidste dag d. 27 Jan

Læs mere

Side 1 of 11. Kursus navn: Kursus nr Introduktion til Bioinformatik

Side 1 of 11. Kursus navn: Kursus nr Introduktion til Bioinformatik Side 1 of 11 Danmarks Tekniske Universitet Skriftlig prøve, den 22/1-2015 Kursus navn: Kursus nr. 27633 Introduktion til Bioinformatik Tilladte hjælpemidler: Alle "Vægtning" Angivet ved de individuelle

Læs mere

Immunologisk bioinformatik

Immunologisk bioinformatik Immunologisk bioinformatik Øvelsesvejledning Introduktion til øvelsen Når man i dagligdagen taler om influenza, bliver virussen ofte forbundet med forbigående og ufarlig sygdom. Som regel har mennesker

Læs mere

Danmarks Tekniske Universitet

Danmarks Tekniske Universitet Side 1 of 17 Danmarks Tekniske Universitet Skriftlig prøve, den 21/1-2013 Kursus navn: Kursus nr. 27633 Introduktion til Bioinformatik Tilladte hjælpemidler: Alle "Vægtning" Angivet ved de individuelle

Læs mere

Danmarks Tekniske Universitet

Danmarks Tekniske Universitet Side 1 of 14 Danmarks Tekniske Universitet Skriftlig prøve, den 21/1-2013 Kursus navn: Kursus nr. 27633 Introduktion til Bioinformatik Tilladte hjælpemidler: Alle "Vægtning" Angivet ved de individuelle

Læs mere

Side%1%af%14% Eksamen: Bioinformatik It og Sundhed 27 Jan 2011 kl 9-13

Side%1%af%14% Eksamen: Bioinformatik It og Sundhed 27 Jan 2011 kl 9-13 Side1af14 Eksamen: Bioinformatik It og Sundhed 27 Jan 2011 kl 9-13 Navn: Studie nummer: Dette eksamenssæt vil også kunne ses som en pdf fil nederst på kursus-hjemmesiden udfor den sidste dag d. 27 Jan

Læs mere

Side 1 of 12. Kursus navn: Kursus nr Introduktion til Bioinformatik

Side 1 of 12. Kursus navn: Kursus nr Introduktion til Bioinformatik Side 1 of 12 Danmarks Tekniske Universitet Skriftlig prøve, den 20/1-2014 Kursus navn: Kursus nr. 27633 Introduktion til Bioinformatik Tilladte hjælpemidler: Alle "Vægtning" Angivet ved de individuelle

Læs mere

27611 Eksamen Sommer 2008

27611 Eksamen Sommer 2008 27611 Eksamen Sommer 2008 Dette sæt indeholder 10 opgaver. En online version af opgavesættet vil være tilgængeligt fra kursets lektionsplan under selve eksamen ( juni 2008 klokken 15:00-19:00). DNA/Protein

Læs mere

Danmarks Tekniske Universitet. Løsningsforslag til Øvelse i Immonologisk Bioinformatik

Danmarks Tekniske Universitet. Løsningsforslag til Øvelse i Immonologisk Bioinformatik Danmarks Tekniske Universitet Løsningsforslag til Øvelse i Immonologisk Bioinformatik Indledning De følgende sider giver en gennemgang af de øverlser i har lavet under jeres besøg på DTU, som en del af

Læs mere

Danmarks Tekniske Universitet. Kursus navn: Introduktion til Bioinformatik. Kursus nummer: Hjælpemidler: alle.

Danmarks Tekniske Universitet. Kursus navn: Introduktion til Bioinformatik. Kursus nummer: Hjælpemidler: alle. 1 Danmarks Tekniske Universitet Skriftlig prøve, den 23. maj 2012 Side 1 af 10 sider Kursus navn: Introduktion til Bioinformatik Kursus nummer: 27611 Hjælpemidler: alle Varighed: 4 timer Vægtning: Angivet

Læs mere

Bioinformatik Open Source Software i biologiens tjeneste

Bioinformatik Open Source Software i biologiens tjeneste Bioinformatik Open Source Software i biologiens tjeneste Kenneth Geisshirt kneth@silex.dk Silex Science ApS Bioinformatik p.1/19 Om Silex Science ApS Grundlagt maj 2002 Ejeren er Cortex Holding Fokusområderne

Læs mere

27611 Eksamen Sommer 2007

27611 Eksamen Sommer 2007 - Side 1 af 10-27611 Eksamen Sommer 2007 Dette sæt indeholder 4 opgaver. En online version af opgavesættet vil være tilgængeligt fra kursets lektionsplan, under selve eksamen (25. Maj 2007 klokken 9:00

Læs mere

Side 1 of 13. Kursus navn: Kursus nr Introduktion til Bioinformatik

Side 1 of 13. Kursus navn: Kursus nr Introduktion til Bioinformatik Side 1 of 13 Danmarks Tekniske Universitet Skriftlig prøve, den 20/1-2014 Kursus navn: Kursus nr. 27633 Introduktion til Bioinformatik Tilladte hjælpemidler: Alle "Vægtning" Angivet ved de individuelle

Læs mere

Proteiners byggesten er aminosyrer

Proteiners byggesten er aminosyrer PTEIE G EZYME Proteiners byggesten er aminosyrer Lad os se på den kemiske opbygning af et protein. Proteiner er store molekyler der er opbygget af mindre molekyler, som man kalder aminosyrer. Der findes

Læs mere

Side 1 of 12. Kursus navn: Kursus nr Introduktion til Bioinformatik

Side 1 of 12. Kursus navn: Kursus nr Introduktion til Bioinformatik Side 1 of 12 Danmarks Tekniske Universitet Skriftlig prøve, den 22/1-2015 Kursus navn: Kursus nr. 27633 Introduktion til Bioinformatik Tilladte hjælpemidler: Alle "Vægtning" Angivet ved de individuelle

Læs mere

Databasesøgning med BLAST

Databasesøgning med BLAST Databasesøgning med BLAST Denne vejledning giver en introduktion til databasesøgning med forskellige programmer i BLAST-familien. Vejledningen indeholder først en grundig introduktion og gennemgang af

Læs mere

Svar til sommereksamen 2014, opdateret maj 2016:

Svar til sommereksamen 2014, opdateret maj 2016: Svar til 27611 sommereksamen 2014, opdateret maj 2016: ER proteiner, KDEL motiv og KDEL receptor Opgave 1 - Karakterisering af KDEL receptoren Spørgsmål a: Der er 1776 proteiner i UniProt, der hedder "ER

Læs mere

Genetiske afstande og afstandsmatricer

Genetiske afstande og afstandsmatricer Genetiske afstande og afstandsmatricer Denne vejledning indeholder en række små øvelser og opgaver der illustrerer, hvordan man ud fra genetiske sekvenser kan udregne en gennemsnitlig evolutionær afstand

Læs mere

Geneious en manual til elevbrug

Geneious en manual til elevbrug REGN MED BIOLOGI SUPPLERENDE MATERIALE (4.3) Geneious en manual til elevbrug Indhold INTRODUKTION TIL GENEIOUS... 2 DATABASERNE HOS NCBI... 2 ORGANISÉR PROJEKTET... 3 SØGNING... 3 UDVIDET SØGNING... 4

Læs mere

Struktur og funktion af gener

Struktur og funktion af gener Molekylærbiologi og genetik S4, F2008 f Malene Munk Jørgensen Emne: Struktur og funktion af gener Link: undervisningsplanen for S4-molekylærbiologi og genetik MMJ, VI niversity ollege Bioanalytikeruddannelsen

Læs mere

Svar til sommereksamen 2014, opdateret 30. april 2018:

Svar til sommereksamen 2014, opdateret 30. april 2018: Svar til 27611 sommereksamen 2014, opdateret 30. april 2018: ER proteiner, KDEL motiv og KDEL receptor Opgave 1 - Karakterisering af KDEL receptoren Spørgsmål a: Der er 2577 proteiner i UniProt, der hedder

Læs mere

På grund af reglerne for copyright er det ikke muligt at lægge figurer fra lærebøger på nettet. Derfor har jeg fjernet figurerne fra slides ne, men

På grund af reglerne for copyright er det ikke muligt at lægge figurer fra lærebøger på nettet. Derfor har jeg fjernet figurerne fra slides ne, men På grund af reglerne for copyright er det ikke muligt at lægge figurer fra lærebøger på nettet. Derfor har jeg fjernet figurerne fra slides ne, men skrevet hvorfra de er taget. De tre bøger, hvorfra illustrationerne

Læs mere

PCR (Polymerase Chain Reaction): Opkopiering af DNA

PCR (Polymerase Chain Reaction): Opkopiering af DNA PCR (Polymerase Chain Reaction): Opkopiering af DNA PCR til at opkopiere bestemte DNA-sekvenser i en prøve er nu en af genteknologiens absolut vigtigste værktøjer. Peter Rugbjerg, Biotech Academy PCR (Polymerase

Læs mere

Skruedyrenes evolution

Skruedyrenes evolution Skruedyrenes evolution Materialer: 8 forskellige søm og skruer per hold. Formål: At tegne et slægtskabstræ udfra morfologiske karaktertræk Når arterne er blevet indsamlet og identificeret, skal de systematiseres.

Læs mere

Biologi opgave Opsamling: Cellebiologi (Bioanalytiker modul3)

Biologi opgave Opsamling: Cellebiologi (Bioanalytiker modul3) 1 Delphine Bonneau Biologi opgave Opsamling: Cellebiologi 1-6 Pelle har spist en kæmpe stor kage, og efterfølgende stiger hans blodsukker. Derfor sender kroppen besked til de endokrine kirtler i bugspytkirtlen

Læs mere

Danmarks Tekniske Universitet

Danmarks Tekniske Universitet Side 1 of 14 Danmarks Tekniske Universitet Skriftlig prøve, den 26/1-2012 Kursus navn: Kursus nr. 27633 Introduktion til Bioinformatik Tilladte hjælpemidler: Alle "Vægtning" Angivet ved de individuelle

Læs mere

Biosensor Niveau 1. Teori

Biosensor Niveau 1. Teori Biosensor Niveau 1 Teori Inden du starter... For at kunne forstå teorien som ligger til grund for en biosensor er det vigtigt at du har styr på nogle generelle mikro/molekyler biologiske principper, begreber

Læs mere

Dansk resumé for begyndere

Dansk resumé for begyndere Dansk resumé for begyndere Dansk resumé for begyndere Dette afsnit introducerer bakteriel genregulation for enhver uden forudgående kendskab til dette emne. Alle nødvendige, videnskabelige betegnelser

Læs mere

Identifikation af potentielle microrna gener ved hjælp af komparativ genomanalyse

Identifikation af potentielle microrna gener ved hjælp af komparativ genomanalyse Identifikation af potentielle microrna gener ved hjælp af komparativ genomanalyse Per Tøfting 23. september 2008 Speciale i softwarekonstruktion IT-Vest Aarhus Universitet Agenda Formål microrna Strategien

Læs mere

Proteiner: en introduktion. Modul 1; F13 Rolf Andersen, 18/2-2013

Proteiner: en introduktion. Modul 1; F13 Rolf Andersen, 18/2-2013 Proteiner: en introduktion Modul 1; F13 Rolf Andersen, 18/2-2013 4 facts om proteiner Proteiner udgør én af de vigtigste stofgrupper i vores organisme; de varetager en lang række forskellige funktioner.

Læs mere

Banan DNA 1/6. Formål: Formålet med øvelsen er at give eleverne mulighed for at se DNA strenge med det blotte øje.

Banan DNA 1/6. Formål: Formålet med øvelsen er at give eleverne mulighed for at se DNA strenge med det blotte øje. Banan DNA Formål: Formålet med øvelsen er at give eleverne mulighed for at se DNA strenge med det blotte øje. Baggrundsviden: Om vi er mennesker, dyr eller planter, så har alle organismer DNA i deres celler.

Læs mere

SUBS_BACLE 1 0 ELYA_BACHD 1 MRQSLKVMVLSTVALLFMANPAAASEEKKEYLIVVEPEEVSAQSVEESYD 50

SUBS_BACLE 1 0 ELYA_BACHD 1 MRQSLKVMVLSTVALLFMANPAAASEEKKEYLIVVEPEEVSAQSVEESYD 50 Svar til Parvis Alignment øvelsen - Af: Rasmus Wernersson Q1: FASTA format. Q2: # Length: 361 # Identity: 176/361 (48.8%) # Similarity: 214/361 (59.3%) # Gaps: 92/361 (25.5%) # Score: 916.0 SUBS_BACLE

Læs mere

Danmarks Tekniske Universitet

Danmarks Tekniske Universitet Side 1 af 1 Danmarks Tekniske Universitet Side 1 af 11 sider Skriftlig prøve, den 27/5-2010 Kursus navn: Kursus nr. 27611 Introduktion til Bioinformatik Tilladte hjælpemidler: Alle "Vægtning" Angivet ved

Læs mere

BIOLOGI A-NIVEAU NY ORDNING. Tirsdag den 19. august 2008. Kl. 09.00 14.00 STX082-BIA STUDENTEREKSAMEN AUGUST 2008

BIOLOGI A-NIVEAU NY ORDNING. Tirsdag den 19. august 2008. Kl. 09.00 14.00 STX082-BIA STUDENTEREKSAMEN AUGUST 2008 STUDENTEREKSAMEN AUGUST 2008 BIOLOGI A-NIVEAU Tirsdag den 19. august 2008 NY ORDNING Kl. 09.00 14.00 Af opgaverne 1, 2, 3 og 4 skal tre og kun tre af opgaverne besvares STX082-BIA Undervisningsministeriet

Læs mere

Er der flere farver i sort?

Er der flere farver i sort? Er der flere farver i sort? Hvad er kromatografi? Kromatografi benyttes inden for mange forskellige felter og forskningsområder og er en anvendelig og meget benyttet analytisk teknik. Kromatografi bruges

Læs mere

at du trænes i at genkende aminosyrer i en simpel proteinstruktur (pentapeptid = lille protein bestående af 5 (penta) aminosyrer)

at du trænes i at genkende aminosyrer i en simpel proteinstruktur (pentapeptid = lille protein bestående af 5 (penta) aminosyrer) Elevvejledning til det Virtuelle Kræftlaboratorium Det Virtuelle Kræftlaboratorium stiller krav til en grundig forståelse af det centrale dogme inden for molekylærbiologien, hvordan DNA oversættes til

Læs mere

Proteiner. Proteiner er molekyler der er opbygget af "aminosyrer",nogle er sammensat af få aminosyrer medens andre er opbygget af mange tusinde

Proteiner. Proteiner er molekyler der er opbygget af aminosyrer,nogle er sammensat af få aminosyrer medens andre er opbygget af mange tusinde Proteiner Proteiner er molekyler der er opbygget af "aminosyrer",nogle er sammensat af få aminosyrer medens andre er opbygget af mange tusinde Der findes ca. 20 aminosyrer i menneskets organisme. Nogle

Læs mere

Velkommen. Test dit eget DNA med PCR. Undervisningsdag på DTU Systembiologi. Undervisere: Sebastian, Louise og Ana

Velkommen. Test dit eget DNA med PCR. Undervisningsdag på DTU Systembiologi. Undervisere: Sebastian, Louise og Ana Velkommen Test dit eget DNA med PCR Undervisningsdag på DTU Systembiologi Undervisere: Sebastian, Louise og Ana Hvem er I? 2 DTU Systembiologi, Danmarks Tekniske Universitet Dagens program 9:00 10:00 Introduktion

Læs mere

Velkommen. Test dit eget DNA med PCR. Undervisningsdag på DTU Systembiologi. Undervisere:

Velkommen. Test dit eget DNA med PCR. Undervisningsdag på DTU Systembiologi. Undervisere: Velkommen Test dit eget DNA med PCR Undervisningsdag på DTU Systembiologi Undervisere: Hvem er I? 2 DTU Systembiologi, Danmarks Tekniske Universitet Hvilke baser indgår i DNA? A. Adenin, Guanin, Cytosin,

Læs mere

Bioteknologi A. Gymnasiale uddannelser. Vejledende opgavesæt 1. Mandag den 31. maj 2010 kl. 9.40-14.40. 5 timers skriftlig prøve

Bioteknologi A. Gymnasiale uddannelser. Vejledende opgavesæt 1. Mandag den 31. maj 2010 kl. 9.40-14.40. 5 timers skriftlig prøve Vejledende opgavesæt 1 Bioteknologi A Gymnasiale uddannelser 5 timers skriftlig prøve Vejledende opgavesæt 1 Mandag den 31. maj 2010 kl. 9.40-14.40 Side 1 af 8 sider pgave 1. Genmodificeret ris Vitamin

Læs mere

Eksamensnummer. Multiple choice opgaver. Side 1 af 10. Hvert svar vægtes 1 point 1.1 A 1.2 E 1.3 C 1.4 B 2.1 F 2.2 C 2.3 D 3 D 4 E

Eksamensnummer. Multiple choice opgaver. Side 1 af 10. Hvert svar vægtes 1 point 1.1 A 1.2 E 1.3 C 1.4 B 2.1 F 2.2 C 2.3 D 3 D 4 E Multiple choice opgaver. Hvert svar vægtes 1 point Opgave Svar 1.1 A 1.2 E 1.3 C 1.4 B 2.1 F 2.2 C 2.3 D 3 D 4 E 5 C 6 B 7 B 8 C 9 B 10 E 11.1 A 11.2 A 11.3 I 12 E 13 E 14 A 15 A 16.1 K 16.2 A 16.3 M Side

Læs mere

Herunder er vist en afstandsmatrice for fem pattedyr: Ulv (U), moskusokse (M), kænguru (K), isbjørn (I) og vildsvin (V).

Herunder er vist en afstandsmatrice for fem pattedyr: Ulv (U), moskusokse (M), kænguru (K), isbjørn (I) og vildsvin (V). Fylogenetiske træer Dette dokument indeholder først et eksempel på hvordan man kan bruge UPGMA-metoden til at danne fylogenetiske træer ud fra en afstandsmatrice, og derefter en række øvelser der illustrerer

Læs mere

Biologiske signaler i graviditeten - Genetisk information

Biologiske signaler i graviditeten - Genetisk information Biologiske signaler i graviditeten - Genetisk information 2 I forbindelse med vores studie af graviditeten ønsker vi at foretage undersøgelser af arvematerialet (DNA og RNA). Disse genetiske undersøgelser

Læs mere

Danmarks Tekniske Universitet

Danmarks Tekniske Universitet Side 1 of 16 Danmarks Tekniske Universitet Skriftlig prøve, den 26/1-2012 Kursus navn: Kursus nr. 27633 Introduktion til Bioinformatik Tilladte hjælpemidler: Alle "Vægtning" Angivet ved de individuelle

Læs mere

Vejledning til Google Analytics rapporter

Vejledning til Google Analytics rapporter Vejledning til Google Analytics rapporter Internet statistik kan godt være svært at forstå specielt hvis man ikke er vant til at arbejde med sådanne ting. For at gøre det nemmere for vores kunder at forstå

Læs mere

FORCE Inspect Online Manual v. 1.02. FORCE Inspect Online Manual. 1 af 18

FORCE Inspect Online Manual v. 1.02. FORCE Inspect Online Manual. 1 af 18 FORCE Inspect Online Manual 1 af 18 Indholdsfortegnelse Indholdsfortegnelse... 2 FORCE Inspect Online Manual... 3 Generelt... 3 Login... 3 Main... 4 Intro sektion... 4 Links sektion... 4 News sektion...

Læs mere

Læsevejledning til resultater på regions- og sygehusplan

Læsevejledning til resultater på regions- og sygehusplan Læsevejledning til resultater på regions- og sygehusplan Indhold 1. Overblik...2 2. Sammenligninger...2 3. Hvad viser figuren?...3 4. Hvad viser tabellerne?...6 6. Eksempler på typiske spørgsmål til tabellerne...9

Læs mere

1. Hvad er kræft, og hvorfor opstår sygdommen?

1. Hvad er kræft, og hvorfor opstår sygdommen? 1. Hvad er kræft, og hvorfor opstår sygdommen? Dette kapitel fortæller om, cellen, kroppens byggesten hvad der sker i cellen, når kræft opstår? årsager til kræft Alle levende organismer består af celler.

Læs mere

Hjemmesiden er opdelt i et sidehoved, en sidefod og mellem disse 3 kolonner: venstre, midterste og højre. Højre kolonne vises dog kun på forsiden.

Hjemmesiden er opdelt i et sidehoved, en sidefod og mellem disse 3 kolonner: venstre, midterste og højre. Højre kolonne vises dog kun på forsiden. Hjemmesiden er opdelt i et sidehoved, en sidefod og mellem disse 3 kolonner: venstre, midterste og højre. Højre kolonne vises dog kun på forsiden. VENSTRE kolonne indeholder flere elementer (se illustration

Læs mere

Menneskets væskefaser

Menneskets væskefaser Menneskets væskefaser Mennesket består af ca. 60% væske (vand) Overordnet opdelt i to: Ekstracellulærvæske og intracellulærvæske Ekstracellulærvæske udgør ca. 1/3 Interstitielvæske: Væske der ligger mellem

Læs mere

LUP Fødende læsevejledning til afdelingsrapporter

LUP Fødende læsevejledning til afdelingsrapporter Indhold Hvordan du bruger læsevejledningen... 1 Oversigtsfigur... 2 Temafigur... 3 Spørgsmålstabel... 4 Respondenter og repræsentativitet... 6 Uddybende forklaring af elementer i figurer og tabeller...

Læs mere

Enzymer og katalysatorer

Enzymer og katalysatorer Enzymer og katalysatorer Reaktionsligningen: viser den kemiske reaktion, der leverer energi til alle stofskifteprocesser i cellerne i kroppen. Kemisk er der tale om en forbrændingsproces, hvori atmosfærisk

Læs mere

Introduktion til de praktiske øvelser

Introduktion til de praktiske øvelser Introduktion til de praktiske øvelser Vi vil i dag fokusere på tre forskellige online so4ware 6l SNP analyser snptree NDtree CSIphylogony Introduktion til SNP analyser h@p://cge.cbs.dtu.dk/services/all.php

Læs mere

Velkommen Immunologisk Bioinformatik

Velkommen Immunologisk Bioinformatik Velkommen Immunologisk Bioinformatik EduForce undervisere: Hvem er vi? 2 DTU Systembiologi, Danmarks Tekniske Universitet Hvem er I? 3 DTU Systembiologi, Danmarks Tekniske Universitet Dagens Program Kl.

Læs mere

Biotechnology Explorer. Protein Fingerprinting

Biotechnology Explorer. Protein Fingerprinting Biotechnology Explorer Protein Fingerprinting Instruktionsmanual Katalognummer 166-0100EDU explorer.bio-rad.com Delene i dette kit er sendt i seperate æsker. Opbevar proteinstandarderne i fryseren, ved

Læs mere

Kresten Cæsar Torp Supplerende materiale til Biokemibogen liv, funktion, molekyle

Kresten Cæsar Torp Supplerende materiale til Biokemibogen liv, funktion, molekyle BIOINFORMATIK Kresten Cæsar Torp Supplerende materiale til Biokemibogen liv, funktion, molekyle indhold DNA 2 Hvilke databaser skal man vælge? 2 Søgning på en nukleotidsekvens 2 Proteiner 4 Søgning på

Læs mere

LUP læsevejledning til regionsrapporter

LUP læsevejledning til regionsrapporter Indhold Overblik... 2 Sammenligninger... 2 Hvad viser figuren?... 3 Hvad viser tabellerne?... 5 Eksempler på typiske spørgsmål til tabellerne... 6 Øvrigt materiale Baggrund og metode for LUP Fødende: Analysemetoderne,

Læs mere

BM121 Resume af tirsdags forlæsningen, Uge 47

BM121 Resume af tirsdags forlæsningen, Uge 47 BM121 Resume af tirsdags forlæsningen, Uge 47 Morten Källberg (kallberg@imada.sdu.dk) 22/11-2005 1 Probabilistiske modeller Vi vil i det følgende betragte to forskellige måder at evaluerer en given model

Læs mere

MANUAL. Siteloom CMS

MANUAL. Siteloom CMS MANUAL Siteloom CMS www.hjerteforeningen.dk/cms Brugernavn: Password: 3. september, 2012 BASIS FUNKTIONER 1. Kalender... 4 1.a. Opret... 5 1.b. Rediger eller slet... 8 2. Sider... 10 2.a Opret side...

Læs mere

Skabelonfilen er udarbejdet i Word til Windows (Office 2010) og er også afprøvet i Word til Mac.

Skabelonfilen er udarbejdet i Word til Windows (Office 2010) og er også afprøvet i Word til Mac. Nordiske Studier i Leksikografi 13 (København 2015) Brug af stilark Vi vil gerne have at alle forfattere benytter den Word-fil som redaktionen har udarbejdet og sendt ud, både forfattere og redaktører

Læs mere

Cash Flow Forecast 1

Cash Flow Forecast 1 Cash Flow Forecast 1 Indholdsfortegnelse Introduktion til Cash Flow Forecast... 3 Formål... 3 Du kan... 3 Det skal du bruge for at få adgang til værktøjet... 3 Cash Flow Forecast egenskaber... 3 Tilføjelser...

Læs mere

Huskesedler. Design og automatisering af regneark. Microsoft Excel 2013

Huskesedler. Design og automatisering af regneark. Microsoft Excel 2013 Huskesedler Design og automatisering af regneark Microsoft Excel 2013 Januar 2017 Knord Side 2 Indholdsfortegnelse Ark... 4 Beskyttelse... 6 Diagram... 7 Eksport af data... 8 Fejlretning i formler... 9

Læs mere

LUP læsevejledning til afdelingsrapporter

LUP læsevejledning til afdelingsrapporter Indhold Hvordan du bruger læsevejledningen... 1 Oversigtsfigur... 2 Temafigur... 3 Spørgsmålstabel... 4 Respondenter og repræsentativitet... 6 Uddybende forklaring af elementer i figurer og tabeller...

Læs mere

Deoxyribonukleinsyre

Deoxyribonukleinsyre DNAs Forunderlige struktur Ved Rebecca E.-Sørensen stud.scient i medicinalkemi ved Aarhus Universitet Deoxyribonukleinsyre Strukturen af DNA findes af James D. Watson og Francis H. Crick i 1953 1 Nuklein

Læs mere

FSFIs lynguide til DFRs elektronisk bevissystem

FSFIs lynguide til DFRs elektronisk bevissystem FSFIs lynguide til DFRs elektronisk bevissystem Dette er en kort guide i anvendelsen af Dansk Førstehjælpsråd elektroniske bevissystem. Guiden viser og forklarer hvordan du som instruktør og medlem af

Læs mere

Sådan indlægges nyheder på DSqF s hjemmeside trin for trin

Sådan indlægges nyheder på DSqF s hjemmeside trin for trin Sådan indlægges nyheder på DSqF s hjemmeside trin for trin Systemkrav For at kunne bruge Composite kræves: Windows 95 eller nyere (bemærk - kun Windows kan bruges) Browseren Internet Explorer 6.0 eller

Læs mere

Protein syntese. return

Protein syntese. return Protein syntese. I artiklen redegøres for principperne i, hvordan octapeptidet SCHTFGDI kan syntetiseres. Som yderligere illustration heraf kan peptidet opbygges og visualiseres i Chem3D-Pro. Herved kan

Læs mere

Side 1 of 16. Du skal i opgaven skrive en sorteret liste af Blast e-værdier, med den mest signifikante (laveste) I toppen af listen.

Side 1 of 16. Du skal i opgaven skrive en sorteret liste af Blast e-værdier, med den mest signifikante (laveste) I toppen af listen. Side 1 of 16 Opgave 1 - Generel Bioinformatik (5%) Du skal i opgaven skrive en sorteret liste af Blast e-værdier, med den mest signifikante (laveste) I toppen af listen. Man skal huske at en e-værdi her

Læs mere

Mandags Chancen. En optimal spilstrategi. Erik Vestergaard

Mandags Chancen. En optimal spilstrategi. Erik Vestergaard Mandags Chancen En optimal spilstrategi Erik Vestergaard Spilleregler denne note skal vi studere en optimal spilstrategi i det spil, som i fjernsynet går under navnet Mandags Chancen. Spillets regler er

Læs mere

Introduktion til de praktiske øvelser

Introduktion til de praktiske øvelser Introduktion til de praktiske øvelser Vi vil i dag fokusere på tre forskellige online software til SNP analyser snptree NDtree CSIphylogony Introduktion til SNP analyser http://cge.cbs.dtu.dk/services/all.php

Læs mere

Pædagogisk vejledning til. Materialesæt. Sphero. http://via.mitcfu.dk/99872760

Pædagogisk vejledning til. Materialesæt. Sphero. http://via.mitcfu.dk/99872760 Pædagogisk vejledning til Materialesæt Sphero http://via.mitcfu.dk/99872760 Pædagogisk vejledning til materialesættet Sphero Materialesættet kan lånes hos VIA Center for Undervisningsmidler og evt. hos

Læs mere

Besvarelse af opgaverne til den Spm.A: efter TGA TCA Spm. B:

Besvarelse af opgaverne til den Spm.A: efter TGA TCA Spm. B: Besvarelse af opgaverne til den 20-9-06 Spm.A: Her vil vi gerne sætte et relativt lille stykke DNA (FLAG) sammen med et relativt stort stykke (PRB1). Det lille stykke er for lille til at vi kan PCR amplificere

Læs mere

Genetiske Aspekter af HCM hos Kat. - en introduktion til forskningsprojektet

Genetiske Aspekter af HCM hos Kat. - en introduktion til forskningsprojektet Genetiske Aspekter af HCM hos Kat - en introduktion til forskningsprojektet Cand. scient. Mia Nyberg, ph.d. stud. mnje@life.ku.dk IMHS, Det Biovidenskabelige Fakultet, Københavns Universitet, Klinisk Biokemisk

Læs mere

ActiveBuilder Brugermanual

ActiveBuilder Brugermanual ActiveBuilder Brugermanual Forfatter: TalkActive I/S Dato: Juni 2004 Version: R. 1.01 Sprog: Dansk Copyright 2004 - Talk Active - all rights reserved. Indhold: 1. INDLEDNING...2 2. QUICK-START...3 3. OPBYGNINGEN

Læs mere

LUP læsevejledning til afdelingsrapporter

LUP læsevejledning til afdelingsrapporter Indhold Hvordan du bruger læsevejledningen... 1 Oversigtsfigur... 2 Temafigur... 3 Spørgsmålstabel... 4 Respondenter og repræsentativitet... 6 Uddybende forklaring af elementer i figurer og tabeller...

Læs mere

Selv om websites er yderst forskellige i deres fremtræden, så kan de stort set alle sammen passes ind i den skabelon som er illustreret herunder:

Selv om websites er yderst forskellige i deres fremtræden, så kan de stort set alle sammen passes ind i den skabelon som er illustreret herunder: Design en praktisk guide. Et design udtrykker dit websites grafiske udseende, lige fra hvilke skrifttyper der anvendes op til hvor navigationen er placeret og hvilke interaktive elementer der skal benyttes.

Læs mere

Specialkort med Valgdata

Specialkort med Valgdata Specialkort med Valgdata Søren Risbjerg Thomsen d. 25. april 2017 Introduktion I det følgende beskrives, hvordan man anvender Valgdata til at skabe specialkort, dvs. kort hvor man selv bestemmer indholdet

Læs mere

katalysatorer f i g u r 1. Livets undfangelse på et celluært plan.

katalysatorer f i g u r 1. Livets undfangelse på et celluært plan. Fra det øjeblik vi bliver undfanget i livmoderen til vi lukker øjnene for sidste gang, er livet baseret på katalyse. Livets undfangelse sker gennem en række komplicerede kemiske reaktioner og for at disse

Læs mere

Vejledning: AMUUDBUD.DK

Vejledning: AMUUDBUD.DK Vejledning: AMUUDBUD.DK Henvendt til uddannelsesinstitutioner Websiden amuudbud.dk bruges af uddannelsesinstitutioner til at ansøge om godkendelse til at udbyde AMU. Du skal have modtaget en e-mail med

Læs mere

Vejledning i brugen af det digitale plantesøgningsprogram

Vejledning i brugen af det digitale plantesøgningsprogram Vejledning i brugen af det digitale plantesøgningsprogram Opsætning af pc Brugen af det digitale plantesøgningsprogram og kortet forudsætter at din computer tillader popups fra netadressen www.gis.slnet.dk

Læs mere

Rationel VinduesDesigner TM Brugervejledning

Rationel VinduesDesigner TM Brugervejledning Rationel VinduesDesigner TM Brugervejledning indhold: introduktion Side 2 Funktionsliste Side 3 Få adgang til systemet Side 4 opload dine billeder Side 5 Sådan bruges systemet Side 6 Gem dine eksempler

Læs mere

Brugervejledning til løntermometeret

Brugervejledning til løntermometeret Brugervejledning til løntermometeret Dette er en brugervejledning til løntermometeret. Vejledningen er skrevet til de to personer, en leder og en medarbejderrepræsentant, som har ansvar for at bruge løntermometeret.

Læs mere

Klip-og-kopier DNA: reparér mutationer med 'genom-redigering' DNA, RNA og protein

Klip-og-kopier DNA: reparér mutationer med 'genom-redigering' DNA, RNA og protein Forskningsnyheder om Huntingtons Sygdom På hverdagssprog Skrevet af forskere. Til det globale HS-fællesskab Klip-og-kopier DNA: reparér mutationer med 'genom-redigering' Forskere kan lave præcise ændringer

Læs mere

Mini-guide til Retox Databasen er tilgængelig fra klik på linket

Mini-guide til Retox Databasen er tilgængelig fra   klik på linket Mini-guide til Retox Databasen er tilgængelig fra www.retox.dk, klik på linket Som udgangspunkt kan alle se arbejdspladsbrugsanvisningerne, hvis man er på regionens netværk. Hvis der skal tilføjes eller

Læs mere

Bachelor i Medicin og Medicin med Industriel Specialisering

Bachelor i Medicin og Medicin med Industriel Specialisering Eksamen 2015 Titel på kursus: Uddannelse: Semester: Introduktion til basalfagene Bachelor i Medicin og Medicin med Industriel Specialisering 1. semester Eksamensdato: 09-02-2016 Tid: kl. 09.00-13.00 Bedømmelsesform:

Læs mere

Lærervejledning Til internet-spillet Kræftkampen og undervisningshæftet Hvorfor opstår kræft? Biologi 8.-9. klasse

Lærervejledning Til internet-spillet Kræftkampen og undervisningshæftet Hvorfor opstår kræft? Biologi 8.-9. klasse kraeftkampen.dk Kræftens Bekæmpelse Lærervejledning Til internet-spillet Kræftkampen og undervisningshæftet Hvorfor opstår kræft? Biologi 8.-9. klasse Hvorfor arbejde med Kræft? Erhvervsskolernes Forlag

Læs mere

Læring af test. Rapport for. Aarhus Analyse Skoleåret

Læring af test. Rapport for. Aarhus Analyse  Skoleåret Læring af test Rapport for Skoleåret 2016 2017 Aarhus Analyse www.aarhus-analyse.dk Introduktion Skoleledere har adgang til masser af data på deres elever. Udfordringen er derfor ikke at skaffe adgang

Læs mere

Tips til siden Slægtstræ

Tips til siden Slægtstræ Tips til siden Slægtstræ Indholdsfortegnelse Indledning 1 Kom godt i gang 1 Kildecitater og links til online arkivalier: 5 Familier 9 Export, import og backup: 10 Folketællinger: 10 Om noter og rapporter

Læs mere

Regressionsanalyse i SurveyBanken

Regressionsanalyse i SurveyBanken Først vælges datasættet De Kommunale Nøgletal. Klik på Variable Description og derefter De Kommunale Nøgletal 2010. De enkelte variable i datasættet bliver nu oplistet og kan vælges. Klik herefter på Analysis

Læs mere

Eksponentielle funktioner for C-niveau i hf

Eksponentielle funktioner for C-niveau i hf Eksponentielle funktioner for C-niveau i hf 2017 Karsten Juul Procent 1. Procenter på en ny måde... 1 2. Bestem procentvis ændring... 2 3. Bestem begyndelsesværdi... 2 4. Bestem slutværdi... 3 5. Vækstrate...

Læs mere

Quick guide Dynamicweb 9. Kom godt i gang med brugen af redigeringsværktøjet bag vores hjemmesideløsning CMS-systemet Dynamicweb

Quick guide Dynamicweb 9. Kom godt i gang med brugen af redigeringsværktøjet bag vores hjemmesideløsning CMS-systemet Dynamicweb Quick guide Dynamicweb 9 Kom godt i gang med brugen af redigeringsværktøjet bag vores hjemmesideløsning CMS-systemet Dynamicweb Indholdsfortegnelse Sådan logger du på... 3 Opbygning... 4 Beskrivelse af

Læs mere

Populationsgenetik hos to hvalarter

Populationsgenetik hos to hvalarter REGN MED BIOLOGI SUPPLERENDE MATERIALE (4.9) Populationsgenetik hos to hvalarter I Regn med biologi side 98, figur 94 vises et fylogenetisk stamtræ over grønlandshval og sydlig rethval. Dette supplerende

Læs mere

Kom i gang med Course Tool 1.2

Kom i gang med Course Tool 1.2 Kom i gang med Course Tool 1.2 Indhold Indledning...2 Pris beregning...2 Anvendelse...2 Open Source...2 Anbefalinger...2 Installation...3 USB-Pen...3 Download Libre Office (Draw)...3 Indstil makrosikkerhed...4

Læs mere

Syv transmembrane receptorer

Syv transmembrane receptorer Syv transmembrane receptorer Receptoren som kommunikationscentral Cellemembranen definerer grænsen mellem en celles indre og ydre miljø, der er meget forskelligt. Det er essentielt for cellens funktion

Læs mere

Hvorfor er genfinding et vanskeligt problem?

Hvorfor er genfinding et vanskeligt problem? 19th January 2005 Genfinding og skjulte Markov-modeller Af Asger Hobolth og Leif Schauser Indledning I disse år kortlægges en række organismers arvelige materiale. Det humane om blev kortlagt i 2001, og

Læs mere

Naturvidenskab og teknologi som makkerpar

Naturvidenskab og teknologi som makkerpar THOMAS RASMUSSEN Naturvidenskab og teknologi som makkerpar Et styrket samarbejde mellem gymnasier, virksomheder og universiteter er en væsentlig faktor, når man skal vise, hvad basisviden kan bruges til

Læs mere