Side 1 af 13. Eksamen: Bioinformatik It og Sundhed 27 Jan 2011 kl 9-13



Relaterede dokumenter
Side 1 af 14. Eksamen: Bioinformatik It og Sundhed 27 Jan 2011 kl 9-13

Side%1%af%14% Eksamen: Bioinformatik It og Sundhed 27 Jan 2011 kl 9-13

Side 1 of 11. Kursus navn: Kursus nr Introduktion til Bioinformatik

Danmarks Tekniske Universitet

Side 1 of 12. Kursus navn: Kursus nr Introduktion til Bioinformatik

Danmarks Tekniske Universitet

Side 1 of 12. Kursus navn: Kursus nr Introduktion til Bioinformatik

Side 1 of 13. Kursus navn: Kursus nr Introduktion til Bioinformatik

Danmarks Tekniske Universitet

Danmarks Tekniske Universitet

27611 Eksamen Sommer 2007

27611 Eksamen Sommer 2008

Danmarks Tekniske Universitet. Kursus navn: Introduktion til Bioinformatik. Kursus nummer: Hjælpemidler: alle.

Svar til sommereksamen 2014, opdateret maj 2016:

Immunologisk Bioinformatik

Svar til sommereksamen 2014, opdateret 30. april 2018:

Danmarks Tekniske Universitet

SUBS_BACLE 1 0 ELYA_BACHD 1 MRQSLKVMVLSTVALLFMANPAAASEEKKEYLIVVEPEEVSAQSVEESYD 50

at du trænes i at genkende aminosyrer i en simpel proteinstruktur (pentapeptid = lille protein bestående af 5 (penta) aminosyrer)

Danmarks Tekniske Universitet. Løsningsforslag til Øvelse i Immonologisk Bioinformatik

Databasesøgning med BLAST

Bioinformatik Open Source Software i biologiens tjeneste

Immunologisk bioinformatik

En forsker har lavet et cdna insert vha PCR og har anvendt det følgende primer sæt, som producerer hele den åbne læseramme af cdna et:

Danmarks Tekniske Universitet

Geneious en manual til elevbrug

Protein databases Rasmus Wernersson. (Slides af Henrik Nielsen & Morten Nielsen).

Side 1 of 16. Du skal i opgaven skrive en sorteret liste af Blast e-værdier, med den mest signifikante (laveste) I toppen af listen.

Immunologisk bioinformatik - et undervisningsprojekt til de danske gymnasier

Proteiners byggesten er aminosyrer

Biologi opgave Opsamling: Cellebiologi (Bioanalytiker modul3)

V E J L E D N I N G. Sådan bruger du din Joblog på Jobnet

Vejledning til brug af web-baserede slægtstavler

Søgevejledning til Cinahl Plus with Full Text (Ebsco) Bibliotekerne i Professionshøjskolen Metropol. Søgevejledning til CINAHL Plus with Full Text

Identifikation af potentielle microrna gener ved hjælp af komparativ genomanalyse

vejman.dk Brugerdokumentation - kortmodul 14. marts 2012 Version 1.9

Proteiner: en introduktion. Modul 1; F13 Rolf Andersen, 18/2-2013

Struktur og funktion af gener

Tre sideopsætninger: 1 Forside. 2 Standard 3 Liste. 1 Forside. 2 Underside. 3 Liste

I denne manual kan du finde en hurtig introduktion til hvordan du:

Velkommen. Test dit eget DNA med PCR. Undervisningsdag på DTU Systembiologi. Undervisere: Sebastian, Louise og Ana

Hvorfor er genfinding et vanskeligt problem?

Opgaver. Notater. Opgave 1: Find kursus hjemmeside og bladre lidt rundt på siderne.

Danmarks Tekniske Universitet

Søgevejledning til SocINDEX with Full Text - 1

Indledning. På de følgende sider vises, primært i tegneserieform, lidt om mulighederne i PC-AXIS for Windows.

Populationsgenetik hos to hvalarter

Indholdsfortegnelse. Indledning System krav side 1

Kom godt i gang med I-bogen

Elevvejledning til Stop Madspild Produktion

Indledning. MIO er optimeret til Internet Explorer. Læs endvidere under Ofte stillede spørgsmål.

TILBAGE TIL DANSK AGAPORNIS KLUB

Case: Zapier-integration mellem simplero og webcrm hos Videokursus

BM121 Resume af tirsdags forlæsningen, Uge 47

Vejledning til tilsynsledere vedr. brug af pc

Protein syntese. return

Rapporter fra spørgeskemaundersøgelsen

Vejledning Bilindretning

CINAHL Complete - tips til søgning

Vejledning til den skrevne patientinformation i Hospitalsenheden Vest

Vejledning i brugen af det digitale plantesøgningsprogram

Mini-vejledning til. PubMed

Velkommen Immunologisk Bioinformatik

Genetiske afstande og afstandsmatricer

Motto-Captura ApS, Ordblinde PDA. Lyt - lær - husk. Motto-Captura ApS, info@motto-captura.eu

The Joanna Briggs Institute EBP Database Vejledning

HR-Centret

Opgaveteknisk vejledning Word 2016 til Mac. Tornbjerg Gymnasium 10. december 2015

Kresten Cæsar Torp Supplerende materiale til Biokemibogen liv, funktion, molekyle

LCD Character display Intro

MakeRoute. Bruger manual

Ordinær vintereksamen 2016/17

Microsoft Word fremgangsmåde til Blomsterhuset Side 1 af 11

Biologiske signaler i graviditeten - Genetisk information

elib Aleph, ver.18 Introduktion til GUI FUJITSU SERVICES A/S

Guide til din private side på Netstambogen

Løndelslister - Kontingenter (Rapport-ID: 66)

Opgaveteknisk vejledning Word 2011 til Mac. Tornbjerg Gymnasium 10. december 2015

Sådan bruger du Google Drev

Modul 2 Database projekt Multimediedesign 3. semester Gruppe 3 IRF/TUJE

Kom i gang med Scopus

Installations og brugermanual for ios - brugere af Akutudkald.

Feriepengeforpligtigelse Manuel beregning på ferietotaler (Rapport-ID: 57)

Vejledning til sæsonbooking

Annemette Søgaard Hansen/

OPERATIONS QUALITY. Brugermanual. Administration af returnering af brugte enheder ( depositumsager )

Vejledning til den skrevne patientinformation i HEV August 2013 /Kommunikation

Dansk resumé for begyndere

Redaktørvejledning for Skriv en artikel

SDBF QUICKGUIDE SKOLERNES DIGITALE BLANKET FLOW - BRUGER-GUIDE -

Quick Guide for TopSURV RTK

Indholdsfortegnelse. Indledning System krav side 2

Opgaveteknisk vejledning Word Tornbjerg Gymnasium 10. december 2015

Annemette Søgaard Hansen/

Vejledning i brug af Informationer på kort

Vejledning til læreren. MG/FG - Skoleportalen

PubMed er en stor sundhedsfaglig database med henvisninger til videnskabelige artikler.

DNA analyse af mulige odderekskrementer

Implementation of MUSCLE using GPU

Transkript:

Side1af13 Eksamen: Bioinformatik It og Sundhed 27 Jan 2011 kl 9-13 Navn: Studie nummer: Dette eksamenssæt vil også kunne ses som en pdf fil nederst på kursus-hjemmesiden udfor den sidste dag d. 27 Jan (Navn: Eksamen_27-1-2011.pdf) Kursus-hjemmeside: http://www.cbs.dtu.dk/courses/bioinformatics_it_and_health/2010/programme.php Eksamenssættet består af 6 hoved-emner 1 6 og til hvert emne er der en række spørgsmål som du skal svare på. Ialt er der 13 sider, hvoraf de to sidste er Appendix 1 og 2. Spørgsmålene du skal svare på står med kursiv Hvis du ikke har tilstrækkelig plads på disse sider så svar på et andet stykke papir, men husk at gengive hvilket spørgsmål du svarer på ved at skrive 1b hvis du svarer på spørgsmål b i opgave 1. Læs opgaverne omhyggeligt inden du begynder. Emner (bedømmelses-vægt i procent) Opgave 1: DNA og RNA (15%) Opgave 2: Aminosyrer (20%) Opgave 3: Uniprot (20%) Opgave 4: Sekvens alignment (20 %) Opgave5:SNP SingleNucleotidepolymorphism(15%) Opgave6:PDB 3D strukturoghomologimodellering(10%) Vi vil logge jeres internet under denne eksamen og alt kommunikation med andre personer via mail, tlf og lignende er diskvalificerende.

Side2af13 Opgave 1: DNA og RNA (15%) a) Hvad kaldes den proces, hvor DNA oversættes til messenger RNA (DNA -> mrna)? b) Hvad kaldes den proces, hvor messenger RNA oversættes til protein (mrna -> protein)? c) Hvad er 1-bogstavs koderne for kerne-baserne (nukleotiderne) i DNA? d) Hvilke af disse kerne-baser danner hydrogen-bindinger til hinanden (kaldet base parring på engelsk)? Herunder er et stykke genomisk DNA (+ string) kaldet gene1 med læseretning fra venstre mod højre gene1: TTGATTGCAA e) Er den korrekt læseretningen for DNA fra 3 mod 5 enden eller omvendt dvs fra 5 mod 3 enden? f) Der fines 3 stop codons: TAA, TAG og TGA. Benyt sekvensen herunder (genea) til at finde alle stop-codons i alle læserammer. Sekvensen er angivet for + stringen, med læseretning fra venstre mod højre. Skriv læseramme efterfulgt af mulige stopcodons. genea: TTGATTTCAA

Side3af13 Opgave 2: Aminosyrer (20%) a) Hvor mange naturligt forekommende aminosyrer findes der? b) En enkelt aminosyre har ikke et chiralt C-alpha atom. Hvad er 1 og 3-bogstavs koderne for denne? Skriv 1 og 3-bogstav koder for aminosyrerne som tilhører de grupper som er listet herunder i spørgsmål c), d) og e) c) Basiske: d) Sure: e) Aromatiske: f) Skriv herunder en korrekt sekvens i FASTA format, med navnet MIN_SEKVENS. Dette korte peptid skal bestå af 5 forskellige aminosyrer som er polære eller hydrophobe benyt 1-bogstavs koder. g) Tegn et di-peptid, hvor du indikerer sidekæden med R. Skriv også navn på de 4 backbone atomer.

Side4af13 Opgave 3: Uniprot (20%) Benyt Advanced Search i Uniprot databasen til at lede efter lysozyme hits for organismen Gallus gallus (Chicken). a) Hvor mange reviewed (dvs UniProtKB/Swiss Prot) hits finder du for lysozyme for organismen Chicken, hvor lysozyme er en del af protein navnet (protein name). skriv antal hits du ender op med til sidst og evt antal hits (søgeresultater) du får undervejs? b) Angiv Accession nummer for et af den/de hits du fandt spørgsmål 3a og skriv, med 1-bogstavs kode og position, de aminosyrer som er del af det aktive site i dette protein? c) Det protein du beskrev i spørgsmål 3b, vil det virke indenfor eller udenfor den celle hvor det bliver lavet. Angiv længden af det modne (English: mature) protein, samt hvor det befinder sig (dvs indenfor eller udenfor cellen). Begrund dine svar. d) For proteinet med accession number P00698( 0 eretnulogikkeetbogstav)er derangivetsekundærstruktureniuniprot.kanduudfradenneangivehvilkenaf de5fold klasser(a,b,c,dellere)proteinettilhører? a. All alpha b. All beta c. Alpha+beta d. Alpha/beta e. Fåelleringensekundærstrukturelementer

Side5af13 4: Sekvens alignment (20 %) Man har søgt med en protein sekvens mod en stor database af sekvenser vha Blast (i protein mode blastp ) og får 4 forskellige alignments tilbage. Resultaterne fra disse 4 alignments beskrives herunder som Hit 1-4. Normalt benyttes e-værdier (også kaldet e-values eller Expection values) til at udvælge det bedste hit. a) Skriv de 4 hits i en ordnet liste under hinanden, således at det bedste hit står øverst og dårligste hit står nederst. Skriv også hvilke hits du vil betragte som signifikante og hvorfor. Hit 1: e-value = 4e-22 Hit 2: e-value= 0 Hit 3: e-value= 3.2 Hit 4: e-value = 0.01

Side6af13 To protein sekvenser kan alignes såfremt man har en substitutions-matrix og et mål for hvad det koster at lave gaps. Herunder er et alignment, hvor Query er en betegnelse for den sekvens man har søgt med, mens Sbjct repræsenterer et hit fundet i en sekvens-database. Affine gap-scores Når man laver et alignment kan man benytte sig af en simple procedure, hvor alle gaps koster det same eller man kan benytte en procedure med affine gap-scores, som er den måde Blast benytter. Når man anvender affine gap-scores, koster det en pris for at åbne et gap (gap-opening) og en anden pris for de næste gaps (gap-next). Gap-opening er altså den pris det koster i en situation hvor man indsætter et gap i et alignment og positionen lige før er ikke et gap. Gap-next er den pris det koster i den situation hvor man indsætter et gap i et alignment og positionen lige før er også et gap. Her skal vi benytte denne procedure med affine gap-scores. Gap-opening score: -11 Gap-next score: -1 b) Hvad er alignment scoren for det hypotetiske alignment som er vist. Benyt Blosum62 matrix i Appendix 1 og proceduren som beskrevet ovenfor i Affine gapscores. Husk at skrive mellem-regninger, ikke kun et tal. pos: 8 15 Query: P R - - Q C K S S Sbjct: P R R E R C R Q T S Pos: 3 12 c)derfindesoverordnettoforskelligetyperafalignments.hvadkaldesdentype alignmentsomervistispørgsmål4b?

Side7af13 d) Herunderer2kortepeptiderSeq1ogSeq2. Seq1:RDVNT Seq2:KIQS Dissesekvenserskalalignesvhaendynamiskalignmentalgoritme,hvoralle gapshverisærkoster2point(dvsenscorepå 2),menssubstitutions scoren fåsudfradenblosum62matrixderfindesiappendix1.duselvbestemme hvilkenafde2hoved alignmenttyperduvælger,menskrivditvalg herunder. d1)jegvælgeralignmenttype: Udfyldherefteralignment matrixpånæstesidehvordetopeptideralignes.

Side8af13 Alignmentmatrix K I Q S 0 2 4 6 8 R 2 D 4 V 6 N 8 T 10 d2)skrivedetfærdigealignmentherundersamtalignment scoren:

Side9af13 5:SNP SingleNucleotidepolymorphism(15%) Herundersessekvensenfordenkodenderegionafetkortgenmedenlængdepå 51bp.Læseretningenerfravenstremodhøjre.Derfindes2SNP sindenfordette område,snp1(g/t)påposition6ogsnp2(t/a)påposition15.rna translation tabelleniappendix2kanbenyttestilnogleafspørgsmålene. SNP1SNP2 ATGCAGCCTATGTGTAACGTGGTCACCCTGATCCGATCGTATGTTTTATTT a) Hvaderforskellenpåensynonym(Eng:synonomous)SNPogenikkesynonym (Eng:non synonomous)snp? b) VilSNP1havenogenindflydelse/ændrepådetproteinproduktsomlavesog hvorlangtbliverproteinsekvensen(begrundditsvar)? c) VilSNP2havenogenindflydelsepådetproteinproduktsomlavesoghvorlangt bliverproteinsekvensen(begrundditsvar)?

Side10af13 6:PDB 3D strukturoghomologimodellering(10%) a) Deforskelligelagafinformationforetproteinbeskrivesoftenmed4ord: primær,sekundær,tertiærogkvaternærstruktur. Beskrivkortbetydningenafdisseord Duskaltilatbyggeenhomologimodelafetprotein.Vedhjælpafen sekvenssøgningipdbhardufundetseksstrukturertilformålet.strukturernes kvalitetsparametreogalignment scorererangivetnedenforitabel1(side11): b)forklarudfraparametreneitabel1(side11),hvilkenstruktur(enellerflere) dervilværebedstatbaseredinmodelpå.begrundditvalg.

Side11af13 c)forklarudfraparametreneitabel1(side11),hvilketrestrukturer,dervilvære dedårligstevalg.begrundditvalg. Tabel1 Struktur A B C D E F E værdi(eng.evalues) 1,0E 09 1,0E 02 1,0E 10 1,0E 12 1,0E 11 1,0E 10 Sekvens id(%) 80 20 81 94 95 93 Metode* X X X X N N Opløsningsevne 2,3 1,4 2,4 4,0 n/a n/a Resolution(Å) R værdi 0,22 0,16 0,24 0,30 n/a n/a R free 0.29 0,20 0,27 0,35 n/a n/a RMSD** n/a n/a n/a n/a 0,3 0,4 Ramachandran statistik(% outliers) 3,0 1,0 2,0 5,0 5,0 2,5 *X=x ray/røntgenkrystallografi,n=nmr,**forensemblet

Side12af13 Appendix1 Blosum62matrix

Side13af13 Appendix2 RNAtranslationtable