Bioinformatik Algoritmiske Aspekter. Christian Nørgaard Storm Pedersen BRICS. Datalogisk Institut Aarhus Universitet.
|
|
- Joachim Ebbesen
- 7 år siden
- Visninger:
Transkript
1 Bioinformatik Algoritmiske Aspekter hristian Nørgaard Storm Pedersen BRIS Datalogisk Institut Aarhus Universitet IT-, April, 2001
2 Bioinformatik Bioinformatik er udvikling og anvendelse af algoritmer og programmer til indsamling, håndtering og analyse af biologisk data ifm. undersøgelser af biologiske processer... Virkeligheden Modeller Problemer Programmer DNA: A T G G T... RNA: A U G U A G G... Protein: Met Arg Leu... Input: a[1..n],b[1..m] Output: dist(a,b) D[0,0..m]=D[0..n,0]=0 FOR i=1 TO n DO FOR j=1 TO m DO D[i,j]= min(d[i-1,j-1]+ d(a[i],b[j]), D[i-1,j]+1, D[i,j-1]+1) OD OD RETURN D[n,m] A G G T ompbio dist(a,b) Bioinformatik involverer... - kendskab til den biologiske virkelighed - formulering af modeller og beregningsproblemer - design og analyse af algoritmer - konstruktion og brug af programmer Fokus afhænger af baggrund: Datalogi, biologi, statistik, medicin... Bioinformatik 1
3 Plan Vi vil fokusere på sekvens-analyse... Tirsdag d. 17. april Molekylær biologi, DNA, RNA og protein Indsamling af sekvensdata, shotgun sequencing Sammenligning af to sekvenser, edit afstand, alignment Forbedringer af model og algoritme, pladsforbrug... Tirsdag d. 24. april Søgning i databaser, lokal alignment Sammenligning af flere sekvenser, multipelt alignment Andre problemer, strukturforudsigelse, DNA hips... Bioinformatik 2
4 Deoxyribo Nucleic Acid Bioinformatik fokuserer på molekylær og genetisk data... Et menneske består af celler. Hver celle indeholder bl.a. 46 kromosomer, DNA molekylær, som lagrer genetisk information, arvemassen : DNA opdaget i køers cellekerner 1953: DNAs dobbelt-helix struktur og Watson- rick basepar A T og G beskrevet 1960: Den genetiske kode brudt... Den menneskelige arvemasse, det human genome, er ca bp langt og indeholder ca gener (Feb 2001). Hvert gen indkoder et protein... Bioinformatik 3
5 Biologiske sekvenser Et gen udtrykkes ved at dets kodende DNA transskriberes til RNA som igen translateres til et protein, en sekvens af aminosyrer... transskription A A G G T U translation TTG TG GG transskription UUG UG GG translation Leu Leu Arg DNA S {A,, G, T } transskription RNA S {A,, G, U} translation Protein S Σ, Σ = 20 Bioinformatik 4
6 Indsamling af sekvensdata 1940 erne: Aminosyre sekvens for insulin [Sanger et al.] 1960 erne: 77 nukleotider af trna [Holley et al., 1965] 1970 erne: nukleotider af virus DNA [Sanger et al., Maxam and Gilbert, 1977] 1990 erne: bp lange DNA sekvenser... DNA Shotgun Sequencing opdel i små overlappende fragmenter ( bp) aflæs hver segment eksperimentielt sammensæt de aflæste segmenter gatg at at agc agat agg gaa at ta gcgc atc ggat aa at at gcg taga aggatgaaatatatatagcgctagatc Sequence Assembly find overlap, lav layout, find konsensus problemer hvis mange gentagelser Double-Barreled Shotgun Sequencing... Algoritmiske problemer er tæt knyttet til eksperimentielle metoder... Bioinformatik 5
7 Tilgængelige Genomer HAEMOPHILUS INFLUENZAE (1995) Størrelse 1.8 millioner basepar. Antal gener HSAHAROMYES EREVISIA (GÆR) (1996) Størrelse 12.1 millioner basepar. Antal gener AENORHABDITIS ELEGANS (ORM) (1998) Størrelse 97 millioner basepar. Antal gener ARABIDOPSIS THALIANA (December 2000) Størrelse 125 millioner basepar. Antal gener DROSOPHILA MELANOGASTER (FLUE) (Marts 2000) Størrelse 185 millioner basepar. Antal gener MUS MUSULUS (Næsten færdigt, 3x dækning, Februar 2001) Størrelse 3000 millioner basepar. Antal gener HOMO SAPIENS (Juni 2000, Februar 2001) Størrelse 3000 millioner basepar. Antal gener Bioinformatik 6
8 Tilgængelig sekvensdata GenBank en database med DNA sekvenser med samlet længde bp (Dec 2000), Mange specialiserede databaser, f.eks. som lagre det humane genome. Annoteringer, opdateringer, krydsreferencer... Focus på WWW and DB teknologi... Bioinformatik 7
9 Evolution af genetisk materiale Genetisk materiale, DNA sekvenser, udvikles over tid ved mutationer... Translocations Inversions Genomer Duplications Insertions Gener Deletions Substitutions GTTAT ins GTTAT del TTAT sub TTGT TTGT dup TTGTTGT trans TGTTGTT inv GTTTGTT Parsimony princippet Den nemmeste vej er et godt estimat af evolutionen, dvs. sekvenser som ligner hinanden er beslægtede og opfører sig ens... Bioinformatik 8
10 Sammenligning af sekvenser En oplagt kilde til biologisk information... Alignment af to sekvenser Givet to sekvenser som er udviklet fra en fælles stamfar, konstruer et alignment således at baser i samme søjle er udviklet fra samme base i den fælles stamfar... : TTGTG A : TTG B : TTGT T T G T T G T insert TG, G Formulering af et beregningsproblem, rekonstruktion af evolutionen... - Hvordan ser den fælles stamfar ud? - Hvilke evolutionære hændelser kan ske? hvordan? Konstruktion af en biologisk rimelig og beregningsmæssig håndterlig evolutionær model er svært og fundamentalt problem... Bioinformatik 9
11 En simpel evolutionærmodel Husk parsimony princippet der siger at den nemmeste vej er et godt estimat af den evolutionære historie... Hvis hændelser er reversible, dvs. hvis s e s så også s e s, så... dist(a, B) = min { E 1 + E 2 A E 1 E 2 B},E 1,E 2 Insert Leu Leu TTGTG G = min { E 1 + E 2 A E 1 E 2 B},E 1,E 2 Leu TTG Leu Leu TTGT = min E { E A E B} G Phe TT Insert Nemmeste vej modelleres som den korteste vej eller billigste vej... Beregning af dist(a, B) og et optimalt edit-script E er et fundamentalt problem indenfor bioinformatik. Problemets kompleksitet afhænger af de tilladte hændelser og deres omkostning... Bioinformatik 10
12 To afstandsproblemer Inversions-afstand: Givet A = π(1,..., n) og B = π(1,..., n), der beskriver rækkefølgen af de samme gener i to organismer. Bestem det mindste antal inversioner der fører A over i B, f.eks. 4, 1, 3, 2, 5 1, 4, 3, 2, 5 1, 2, 3, 4, 5 Et af mange genome rearrangement problemer, men NP-fuldstændigt... Edit-afstand: Givet A Σ og B Σ, der beskriver to biologiske sekvenser. Bestem den billigste sekvens af subs og indels der fører A over i B, hvor en sub af a med b koster d(a, b) og en indel af k symboler koster g(k), f.eks. TTG TTGTG TTGT, pris g(3) + d(g, ) TTG TT TTGT, pris d(g, ) + g(3) Beregnelig i tid O(nm) under rimelige antagelser... Bioinformatik 11
13 Antagelser ifm. edit-afstand Nogle interessante spørgsmål... Hvor mange mulige edit-scripts er der mellem A og B? Hvor mange af disse skal overvejes for at sikre at et optimalt edit-script identificeres? Formulering af en algoritme kræver antagelser om omkostningsfunktionen sub-cost d(a, b) er en metrik, altså d(a, a) = 0 d(a, b) = d(b, a) d(a, b) d(a, c) + d(c, b) gap-cost g(k) er sub-additiv, altså g(k) g(k ) + g(k ), for alle k, k hvor k + k = k Evolutionen har ingen retning og vælger den nemmeste løsning... Bioinformatik 12
14 Edit-afstand og alignment Hvis d(a, b) er en metrik og g(k) er sub-additiv, så kan et optimalt edit-script mellem A og B udtrykkes som et alignment... T T G A T T G TTGT TGT GT T AT ATG g(1) + d(t, ) + g(1) + g(1) + g(1) T T G T A T G TTGT TGT T A ATG d(t, ) + g(2) + d(t, A) + g(2) Parvis alignment: Givet to strenge A[1.. n] og B[1.. m], en metrisk sub-cost d(a, b), og en sub-additiv gap-cost g(k). Bestem et optimal alignment af A og B... Observation: Hvis g(k) = α k, altså lineær, så er prisen for et alignment blot summen af prisen for de enkelte søjler... Bioinformatik 13
15 Formulering af en rekursiv løsning Vi kan beregne dist(a, B) ved at beregne prisen for et optimalt alignment Lad D(i, j) være prisen for et optimalt alignment af A[1.. i] og B[1.. j]. Pr. definition haves D(0,0)=0. Vi kan udtrykke D(i, j) rekursivt ved at betrage den sidste søjle i mulige alignments af A[1.. i] og B[1.. j]. Der er tre muligheder... A[i] B[j ], A[i] or B[j ] Dette giver anledning til følgende rekursion... D(i 1, j 1) + d(a[i], B[j]) i > 0 og j > 0 D(i, j) = min D(i 1, j) + α i > 0 og j 0 D(i, j 1) + α i 0 og j > 0 0 i = 0 og j = 0 D(n, m) er edit-afstanden mellem A og B... Bioinformatik 14
16 Dynamisk programmering func Dist(i,j): if D(i, j) = undef then v 1 = v 2 = v 3 = v 4 = undef if (i > 0) & (j > 0) then v 1 = Dist(i 1,j 1) + d(a[i], B[j]) if (i > 0) & (j 0) then v 2 = Dist(i 1,j) + α if (i 0) & (j > 0) then v 3 = Dist(i,j 1) + α if (i = 0) & (j = 0) then v 4 = 0 D(i, j) = min(v 1, v 2, v 3, v 4 ) endif return D(i, j) endfunc D[0.. n][0.. m] = undef; Dist(n,m) Tid og plads O(nm) Bioinformatik 15
17 En ikke-rekursiv implementation Jvf. rekursion afhænger indgang (i, j) i tabel D kun af indgange i samme og forrige række. Dette kan bruges til at udfylde tabel D iterativt... /* initialisering */ for i = 0 to n do D[i][0] = i α for j = 0 to m do D[0][j] = j α /* udfyld række for række */ for j = 1 to m do endfor for i = 1 to n do endfor D(i, j) = print D(n, m) min(d(i 1, j 1) + d([a[i], B[j]), D(i 1, j) + α, D(i, j 1) + α) D(n, m) er edit-afstanden, men hvordan fås et optimalt alignment? Ved back-tracking i tid O(n + m)... Bioinformatik 16
18 Længste fælles delsekvens Beregning af et optimalt alignment har mange anvendelser... Den længste fælles delsekvens af to strenge A[1.. n] og B[1.. m] er A[i 1 ], A[i 2 ],..., A[i k ], hvor i 1, i 2,..., i k {1, 2,..., min(n, m)} så A[i j ] = B[i j ] og k er maksimal, f.eks. LS(GATAATTGAG,GTTTAAT) = GTAAT Svarer til et optimalt alignment for passende valg af sub-cost og gap-cost. Overvej hvilke? G A T A A T T G A G G T T T A A T Vi kan således beregne LS i tid O(nm), men det er faktisk muligt at beregne LS i tid O(n log n) jvf. [Hirschberg 1977]... Bioinformatik 17
19 En beslægtet algoritme Ønsker ofte at fremhæve similariteter mellem to strenge. Hvis to biologiske sekvenser ligner hinanden, så har de sikkert et eller andet tilfælles... G A T A A T T G A G G T T T A A T Typisk tildeles en score/straf til mulige søjler i et alignment score s(a, b) for en match-søjle ( ) a b straf α for en gap-søjle ( ( a ) eller ) b Beregn et alignment med maksimal score sim(a, B). Dette kan beregnes tilsvarende dist(a, B), blot anvendes max istedet for min... S(i, j) = max S(i 1, j 1) + s(a[i], B[j]) i > 0 og j > 0 S(i 1, j) α i > 0 og j 0 S(i, j 1) α i 0 og j > 0 0 i = 0 og j = 0 Bioinformatik 18
20 Algoritmens oprindelse - V. I. Levenshtein. Binary codes capable of correcting deletions, insertions and reversals. Soviet Physics Doklady, T. K. Vintsyuk. Speech discrimination by dynamic programming. Kibernetika, S. B. Needleman and. D. Wunsch. A general method applicable to the search for similarities in the amino acid sequence of two proteins. Journal of Molecular Biology, D. Sankoff. Matching sequences under deletion/insertion constraints. Proc. of the National Academy of Science of the USA, R. A. Wagner and M. J. Fisher. The string to string correction problem. Journal of the AM, P. H. Sellers. On the theory and computation of evolutionary distance. SIAM Journal of Applied Mathematics, Alle omhandler samme problem, forskellige anvendelser... Bioinformatik 19
21 Forbedringer af model og algoritme Beregning af edit-afstand er kernen i mange anvendelser. Kan forfines vha. pris for hændelser, f.eks. substitution-cost d(x, y) and gap-cost g(k)... Hvis lineær gap-cost g(k) = ak så tid O(n 2 ), generelt tid O(n 3 ) Leu TTG T T G T A T G versus T T G T A T G d(t, ) + g(2) + d(t, A) + g(2) Insert G Leu Leu TTGTG Phe TT G Insert Leu Leu TTGT Korte insertions og deletions er sjældne... affin gap-cost g(k) = ak + b i tid O(n 2 ) [Gotoh, 1982] convex gap-cost i tid O(n 2 log n) [Miller og Myers, 1988] Anden biologisk information... indkodet protein i tid O(n 2 ) [Hein, Lyngsø og Pedersen, 1998] RNA sekundær-struktur i tid O(n 6 ) [Sankoff, 1985] Bioinformatik 20
22 Er tid og plads O(nm) godt nok? Afhænger af længden af typiske sekvenser... Antag n = m = og at vores maskine kan udføre op/sek, så Tid: Begrænsning af tid og plads op op/sek = 1 sek Plads: celler 100 Mb Mange heuristikker, f.eks. kun at beregne et bånd omkring diagonalen i tabellen... T G A T T T G T Længste fælles delsekvens i tid O(n2 ) og plads O(n) En meget anvendelig teknik [Hirschberg, 1975]... men ikke anvendt i praksis før sidst i 1980 erne!! [Myers and Millers, 1989] Bioinformatik 21
Bioinformatik Algoritmiske Aspekter. Christian Nørgaard Storm Pedersen BRICS. Datalogisk Institut Aarhus Universitet.
Bioinformatik Algoritmiske Aspekter Christian Nørgaard Storm Pedersen BRICS Datalogisk Institut Aarhus Universitet IT-C, April, 2001 Bioinformatik Bioinformatik er udvikling og anvendelse af algoritmer
Læs mereBioinformatik Open Source Software i biologiens tjeneste
Bioinformatik Open Source Software i biologiens tjeneste Kenneth Geisshirt kneth@silex.dk Silex Science ApS Bioinformatik p.1/19 Om Silex Science ApS Grundlagt maj 2002 Ejeren er Cortex Holding Fokusområderne
Læs mereIdentifikation af potentielle microrna gener ved hjælp af komparativ genomanalyse
Identifikation af potentielle microrna gener ved hjælp af komparativ genomanalyse Per Tøfting 23. september 2008 Speciale i softwarekonstruktion IT-Vest Aarhus Universitet Agenda Formål microrna Strategien
Læs mereSide 1 af 14. Eksamen: Bioinformatik It og Sundhed 27 Jan 2011 kl 9-13
Side 1 af 14 Eksamen: Bioinformatik It og Sundhed 27 Jan 2011 kl 9-13 Navn: Studie nummer: Dette eksamenssæt vil også kunne ses som en pdf fil nederst på kursus-hjemmesiden udfor den sidste dag d. 27 Jan
Læs mereDynamisk programmering
Dynamisk programmering Dynamisk programmering Et algoritme-konstruktionsprincip ( paradigme ) for optimeringsproblemer. Har en hvis lighed med divide-and-conquer: Begge opbygger løsninger til større problemer
Læs mereDynamisk programmering
Dynamisk programmering Dynamisk programmering Optimeringsproblem: man ønsker at finde bedste den kombinatoriske struktur blandt mange mulige. Dynamisk programmering Optimeringsproblem: man ønsker at finde
Læs mereGenetiske afstande og afstandsmatricer
Genetiske afstande og afstandsmatricer Denne vejledning indeholder en række små øvelser og opgaver der illustrerer, hvordan man ud fra genetiske sekvenser kan udregne en gennemsnitlig evolutionær afstand
Læs mereDanmarks Tekniske Universitet
Side 1 of 14 Danmarks Tekniske Universitet Skriftlig prøve, den 21/1-2013 Kursus navn: Kursus nr. 27633 Introduktion til Bioinformatik Tilladte hjælpemidler: Alle "Vægtning" Angivet ved de individuelle
Læs mereSide 1 of 12. Kursus navn: Kursus nr Introduktion til Bioinformatik
Side 1 of 12 Danmarks Tekniske Universitet Skriftlig prøve, den 20/1-2014 Kursus navn: Kursus nr. 27633 Introduktion til Bioinformatik Tilladte hjælpemidler: Alle "Vægtning" Angivet ved de individuelle
Læs mereSide 1 of 13. Kursus navn: Kursus nr Introduktion til Bioinformatik
Side 1 of 13 Danmarks Tekniske Universitet Skriftlig prøve, den 20/1-2014 Kursus navn: Kursus nr. 27633 Introduktion til Bioinformatik Tilladte hjælpemidler: Alle "Vægtning" Angivet ved de individuelle
Læs mereImplementation of MUSCLE using GPU
Implementation of MUSCLE using GPU Peter Sandberg Brun, 20073790 Mads Sandberg Brun, 20073791 Master s Thesis, Computer Science September 2012 Advisor: Christian Nørgaard Storm Pedersen ii Abstract This
Læs mereDynamisk programmering
Dynamisk programmering Dynamisk programmering Optimeringsproblem: man ønsker at finde bedste den kombinatoriske struktur (struktur opbygget af et endeligt antal enkeltdele) blandt mange mulige. Eksempler:
Læs mereIntroduktion. Introduktion. Algoritmer og datastrukturer. Eksempel: Maksimalt tal
Philip Bille Algoritmer og datastrukturer Algoritmisk problem. Præcist defineret relation mellem input og output. Algoritme. Metode til at løse et algoritmisk problem. Beskrevet i diskrete og entydige
Læs mereIntroduktion. Algoritmer og datastrukturer Toppunkter Algoritme 1 Algoritme 2 Algoritme 3. Philip Bille
Introduktion Algoritmer og datastrukturer Toppunkter Algoritme 1 Algoritme 2 Algoritme 3 Philip Bille Introduktion Algoritmer og datastrukturer Toppunkter Algoritme 1 Algoritme 2 Algoritme 3 Algoritmer
Læs mereSkriftlig Eksamen Algoritmer og Datastrukturer (dads)
Skriftlig Eksamen Algoritmer og Datastrukturer (dads) Datalogisk Institut Aarhus Universitet Tirsdag den 27. maj 2003, kl. 9.00 3.00 Opgave (25%) For konstanten π = 3.4592... gælder identiteten π 2 6 =
Læs mereDanmarks Tekniske Universitet
Side 1 of 17 Danmarks Tekniske Universitet Skriftlig prøve, den 21/1-2013 Kursus navn: Kursus nr. 27633 Introduktion til Bioinformatik Tilladte hjælpemidler: Alle "Vægtning" Angivet ved de individuelle
Læs mereSøgning og Sortering. Søgning og Sortering. Søgning. Linæer søgning
Søgning og Sortering Søgning og Sortering Philip Bille Søgning. Givet en sorteret tabel A og et tal x, afgør om der findes indgang i, så A[i] = x. Sorteret tabel. En tabel A[0..n-1] er sorteret hvis A[0]
Læs mereSkriftlig Eksamen Algoritmer og Datastrukturer (DM507)
Skriftlig Eksamen Algoritmer og Datastrukturer (DM507) Institut for Matematik og Datalogi Syddansk Universitet, Odense Onsdag den 0. juni 009, kl. 9 Alle sædvanlige hjælpemidler (lærebøger, notater, osv.)
Læs mereDanmarks Tekniske Universitet. Løsningsforslag til Øvelse i Immonologisk Bioinformatik
Danmarks Tekniske Universitet Løsningsforslag til Øvelse i Immonologisk Bioinformatik Indledning De følgende sider giver en gennemgang af de øverlser i har lavet under jeres besøg på DTU, som en del af
Læs mereSøgning og Sortering. Philip Bille
Søgning og Sortering Philip Bille Plan Søgning Linæer søgning Binær søgning Sortering Indsættelsesortering Flettesortering Søgning Søgning 1 4 7 12 16 18 25 28 31 33 36 42 45 47 50 1 2 3 4 5 6 7 8 9 10
Læs mereSyntaks og syntaksgenkendelse, særligt regulære udtryk og tilstandsmaskiner og lidt om anvendelser i bioinformatik
Datalogi C, RUC Forelæsning 22. november 2004 Henning Christiansen Syntaks og syntaksgenkendelse, særligt regulære udtryk og tilstandsmaskiner og lidt om anvendelser i bioinformatik Dagens program Hvad
Læs mereImmunologisk bioinformatik
Immunologisk bioinformatik Øvelsesvejledning Introduktion til øvelsen Når man i dagligdagen taler om influenza, bliver virussen ofte forbundet med forbigående og ufarlig sygdom. Som regel har mennesker
Læs mereDATALOGISK INSTITUT, AARHUS UNIVERSITET
DATALOGISK INSTITUT, AARHUS UNIVERSITET Det Naturvidenskabelige Fakultet EKSAMEN Grundkurser i Datalogi Antal sider i opgavesættet (incl. forsiden): 6 (seks) Eksamensdag: Onsdag den 11. august 2004, kl.
Læs mereSøgning og Sortering. Søgning Linæer søgning Binær søgning Sortering Indsættelsessortering Flettesortering. Philip Bille
Søgning og Sortering Søgning Linæer søgning Binær søgning Sortering Indsættelsessortering Flettesortering Philip Bille Søgning og Sortering Søgning Linæer søgning Binær søgning Sortering Indsættelsessortering
Læs mereSkriftlig Eksamen Algoritmer og Datastrukturer 2 (2003-ordning)
Skriftlig Eksamen Algoritmer og Datastrukturer 2 (2003-ordning) Datalogisk Institut Aarhus Universitet Fredag den 28. maj 2004, kl. 9.00 13.00 Opgave 1 (20%) En (r, k) kryds-graf er en orienteret graf
Læs mereSkjulte Markov Modeller og Genidentifikation 2003
Aarhus Universitet 18. december 2003 Datalogisk Institut Ny Munkegade, Bldg. 540 8000 Århus C Skjulte Markov Modeller og Genidentifikation 2003 Niels Christian Bach 19951570 Torben Lauritzen 19940336 Dette
Læs mereSide 1 af 13. Eksamen: Bioinformatik It og Sundhed 27 Jan 2011 kl 9-13
Side1af13 Eksamen: Bioinformatik It og Sundhed 27 Jan 2011 kl 9-13 Navn: Studie nummer: Dette eksamenssæt vil også kunne ses som en pdf fil nederst på kursus-hjemmesiden udfor den sidste dag d. 27 Jan
Læs mereSide%1%af%14% Eksamen: Bioinformatik It og Sundhed 27 Jan 2011 kl 9-13
Side1af14 Eksamen: Bioinformatik It og Sundhed 27 Jan 2011 kl 9-13 Navn: Studie nummer: Dette eksamenssæt vil også kunne ses som en pdf fil nederst på kursus-hjemmesiden udfor den sidste dag d. 27 Jan
Læs mereDanmarks Tekniske Universitet
Side 1 of 16 Danmarks Tekniske Universitet Skriftlig prøve, den 26/1-2012 Kursus navn: Kursus nr. 27633 Introduktion til Bioinformatik Tilladte hjælpemidler: Alle "Vægtning" Angivet ved de individuelle
Læs mereAlgorithms and Architectures I Rasmus Løvenstein Olsen (RLO) Mm2: Rekursive algoritmer og rekurrens - October 12, 2010
Algorithms and Architectures I Rasmus Løvenstein Olsen (RLO) Mm2: Rekursive algoritmer og rekurrens - October 12, 2010 1 Algorithms and Architectures II 1. Introduction to analysis and design of algorithms
Læs merePerspektiverende Datalogikursus
Perspektiverende Datalogikursus Uge 1 - Algoritmer og kompleksitet Gerth Stølting Brodal 27. august 2004 1 Indhold Mere om Eksempler på beregningsproblemer Algoritmer og deres analyse Korrekthed af algoritmer
Læs mereAlgoritmisk geometri
Algoritmisk geometri 1 Intervalsøgning 2 Motivation for intervaltræer Lad der være givet en database over ansatte i en virksomhed Ansat Alder Løn Ansættelsesdato post i databasen Antag, at vi ønsker at
Læs mereDanmarks Tekniske Universitet
Side 1 of 14 Danmarks Tekniske Universitet Skriftlig prøve, den 26/1-2012 Kursus navn: Kursus nr. 27633 Introduktion til Bioinformatik Tilladte hjælpemidler: Alle "Vægtning" Angivet ved de individuelle
Læs mereDanmarks Tekniske Universitet
side af sider Danmarks Tekniske Universitet Skriftlig prøve, den 6. maj 0. Kursusnavn: Algoritmer og datastrukturer I Kursus nr. 005. Tilladte hjælpemidler: Skriftlige hjælpemidler. Varighed: timer Vægtning
Læs mere27611 Eksamen Sommer 2008
27611 Eksamen Sommer 2008 Dette sæt indeholder 10 opgaver. En online version af opgavesættet vil være tilgængeligt fra kursets lektionsplan under selve eksamen ( juni 2008 klokken 15:00-19:00). DNA/Protein
Læs mereAlgorithms and Architectures I Rasmus Løvenstein Olsen (RLO), Jimmy Jessen Nielsen (JJE) Mm2: Rekursive algoritmer og rekurrens - October 10, 2008
Algorithms and Architectures I Rasmus Løvenstein Olsen (RLO), Jimmy Jessen Nielsen (JJE) Mm2: Rekursive algoritmer og rekurrens - October 10, 2008 1 Algorithms and Architectures II 1. Introduction to analysis
Læs mereIntroduktion. Philip Bille
Introduktion Philip Bille Plan Algoritmer og datastrukturer Toppunkter Algoritme 1 Algoritme 2 Algoritme 3 Algoritmer og datastrukturer Hvad er det? Algoritmisk problem: præcist defineret relation mellem
Læs mereDanmarks Tekniske Universitet. Kursus navn: Introduktion til Bioinformatik. Kursus nummer: Hjælpemidler: alle.
1 Danmarks Tekniske Universitet Skriftlig prøve, den 23. maj 2012 Side 1 af 10 sider Kursus navn: Introduktion til Bioinformatik Kursus nummer: 27611 Hjælpemidler: alle Varighed: 4 timer Vægtning: Angivet
Læs mereGen-identifikation ved sekvens-sammenligning. Tejs Scharling. Specialerapport. Datalogisk Institut Aarhus Universitet Danmark
Gen-identifikation ved sekvens-sammenligning Tejs Scharling Specialerapport Datalogisk Institut Aarhus Universitet Danmark Gen-identifikation ved sekvens-sammenligning En specialerapport afleveret til
Læs mereOrienterede grafer. Orienterede grafer. Orienterede grafer. Vejnetværk
Philip Bille Orienteret graf (directed graph). Mængde af knuder forbundet parvis med orienterede kanter. Vejnetværk Knude = vejkryds, kant = ensrettet vej. deg + (6) =, deg - (6) = sti fra til 6 8 7 9
Læs mereIntervalsøgning. Algoritmisk geometri. Motivation for intervaltræer. Intervalsøgning. Lad der være givet en database over ansatte i en virksomhed
Algoritmisk geometri Intervalsøgning 1 2 Motivation for intervaltræer Intervalsøgning Lad der være givet en database over ansatte i en virksomhed Ansat Alder Løn Ansættelsesdato post i databasen Vi kan
Læs mereDATALOGISK INSTITUT, AARHUS UNIVERSITET
DATALOGISK INSTITUT, AARHUS UNIVERSITET Det Naturvidenskabelige Fakultet EKSAMEN Grundkurser i Datalogi Antal sider i opgavesættet (incl. forsiden): 6 (seks) Eksamensdag: Fredag den 0. august 00, kl. 9.00-.00
Læs mereDanmarks Tekniske Universitet
Eksamen 005, F0 side af sider Danmarks Tekniske Universitet Skriftlig prøve, den 6. maj 00. Kursusnavn Algoritmik og datastrukturer I Kursus nr. 005. Tilladte hjælpemidler: Alle skriftlige hjælpemidler.
Læs merePerspektiverende Datalogikursus
Perspektiverende Datalogikursus Uge 1 - Algoritmer og kompleksitet Gerth Stølting Brodal 2. september 2005 1 Afleveringsopgaver... /\.. // \\ / \ / [] \ \\_// / \ / \ []._. ---------------- _ 2 Øvelse
Læs mereSide 1 of 11. Kursus navn: Kursus nr Introduktion til Bioinformatik
Side 1 of 11 Danmarks Tekniske Universitet Skriftlig prøve, den 22/1-2015 Kursus navn: Kursus nr. 27633 Introduktion til Bioinformatik Tilladte hjælpemidler: Alle "Vægtning" Angivet ved de individuelle
Læs mereSkriftlig Eksamen Algoritmer og Datastrukturer (dads)
Skriftlig Eksamen Algoritmer og Datastrukturer (dads) Datalogisk Institut Aarhus Universitet Mandag den 27. maj 2002, kl. 9.00 13.00 Opgave 1 (25%) Denne opgave handler om multiplikation af positive heltal.
Læs mereDanmarks Tekniske Universitet
side af 2 sider Danmarks Tekniske Universitet Skriftlig prøve, den 26. maj 2009. Kursusnavn Algoritmik og datastrukturer I Kursus nr. 0205. Tilladte hjælpemidler: Alle skriftlige hjælpemidler. Vægtning
Læs mereDynamisk programmering. Flere eksempler
Dynamisk programmering Flere eksempler Eksempel 1: Længste fælles delstreng Alfabet = mængde af tegn: {a,b,c,...,z}, {A,C,G,T}, {,1} Eksempel 1: Længste fælles delstreng Alfabet = mængde af tegn: {a,b,c,...,z},
Læs mereDynamisk programmering. Flere eksempler
Dynamisk programmering Flere eksempler Eksempel 1: Længste fælles delstreng Alfabet = mængde af tegn: {a,b,c,...,z}, {A,C,G,T}, {,1} Streng = sekvens x 1 x 2 x 3... x n af tegn fra et alfabet: helloworld
Læs mereImmunologisk bioinformatik - et undervisningsprojekt til de danske gymnasier
Immunologisk bioinformatik - et undervisningsprojekt til de danske gymnasier Isa Kirk Biotech Academy Institut for Systembiologi, Danmarks Tekniske Universitet 2. november 2010 1 Indhold 1 Introduktion
Læs mereDATALOGISK INSTITUT, AARHUS UNIVERSITET
DATALOGISK INSTITUT, AARHUS UNIVERSITET Det Naturvidenskabelige Fakultet EKSAMEN Grundkurser i Datalogi Antal sider i opgavesættet (incl. forsiden): 6 (seks) Eksamensdag: Fredag den 25. juni 200, kl. 9.00-.00
Læs mereSide 1 of 12. Kursus navn: Kursus nr Introduktion til Bioinformatik
Side 1 of 12 Danmarks Tekniske Universitet Skriftlig prøve, den 22/1-2015 Kursus navn: Kursus nr. 27633 Introduktion til Bioinformatik Tilladte hjælpemidler: Alle "Vægtning" Angivet ved de individuelle
Læs mereSkriftlig Eksamen Algoritmer og Datastrukturer (dads)
Skriftlig Eksamen Algoritmer og Datastrukturer (dads) Datalogisk Institut Aarhus Universitet Onsdag den. august 200, kl. 9.00.00 Opgave (25%) Lad A = A[] A[n] være et array af heltal. Længden af det længste
Læs mereMenneskets væskefaser
Menneskets væskefaser Mennesket består af ca. 60% væske (vand) Overordnet opdelt i to: Ekstracellulærvæske og intracellulærvæske Ekstracellulærvæske udgør ca. 1/3 Interstitielvæske: Væske der ligger mellem
Læs mereHamilton-veje og kredse:
Hamilton-veje og kredse: Definition: En sti x 1, x 2,...,x n i en simpel graf G = (V, E) kaldes en hamiltonvej hvis V = n og x i x j for 1 i < j n. En kreds x 1, x 2,...,x n, x 1 i G kaldes en hamiltonkreds
Læs mereSidste gang Motivation Definitioner Approximations-algoritme for knudeoverdækning Approximations-algoritme for TSP med trekantsulighed
Approximations-algoritmer Sidste gang Motivation Definitioner Approximations-algoritme for knudeoverdækning Approximations-algoritme for TSP med trekantsulighed Negativt resultat om generel TSP Approximations-algoritme
Læs mereDATALOGISK INSTITUT, AARHUS UNIVERSITET
DATALOGISK INSTITUT, AARHUS UNIVERSITET Det Naturvidenskabelige Fakultet EKSAMEN Grundkurser i Datalogi Antal sider i opgavesættet (incl. forsiden): 6 (seks) Eksamensdag: Mandag den 11. august 008, kl.
Læs merePerspektiverende Datalogi Klassiske Algoritmer
Perspektiverende Datalogi Klassiske Algoritmer Gerth Stølting Brodal 1 Indhold Eksempler på beregningsproblemer Algoritmer og deres analyse Korrekthed af algoritmer Ressourceforbrug for algoritmer Kompleksitet
Læs mereDefinition : Et træ er en sammenhængende ikke-orienteret graf uden simple kredse. Sætning : En ikke-orienteret graf er et træ hvis og kun hvis der er
Definition : Et træ er en sammenhængende ikke-orienteret graf uden simple kredse. Sætning : En ikke-orienteret graf er et træ hvis og kun hvis der er en unik simpel vej mellem ethvert par af punkter i
Læs mereGrådige algoritmer. Et algoritme-konstruktionsprincip ( paradigme ) for optimeringsproblemer.
Grådige algoritmer Grådige algoritmer Et algoritme-konstruktionsprincip ( paradigme ) for optimeringsproblemer. Grådige algoritmer Et algoritme-konstruktionsprincip ( paradigme ) for optimeringsproblemer.
Læs mereSimple matematiske modeller til beskrivelse af komplekse biologiske systemer. Carsten Wiuf
Århus, den 26. marts 2008 Simple matematiske modeller til beskrivelse af komplekse biologiske systemer Carsten Wiuf Center for Bioinformatik (BiRC) ved Aarhus Universitet Biologien er i disse år i rivende
Læs mereLøs til optimalitet i eksponentiel tid Find tilnærmet løsning i polynomiel tid
6 april Løsning af N P -hårde problemer Løs til optimalitet i eksponentiel tid Find tilnærmet løsning i polynomiel tid Oversigt Grænseværdier (repetition) Branch-and-bound algoritmens komponenter Eksempler
Læs mereGrundlæggende køretidsanalyse af algoritmer
Grundlæggende køretidsanalyse af algoritmer Algoritmers effektivitet Størrelse af inddata Forskellige mål for køretid Store -notationen Klassiske effektivitetsklasser Martin Zachariasen DIKU 1 Algoritmers
Læs mereBM121 Resume af tirsdags forlæsningen, Uge 47
BM121 Resume af tirsdags forlæsningen, Uge 47 Morten Källberg (kallberg@imada.sdu.dk) 22/11-2005 1 Probabilistiske modeller Vi vil i det følgende betragte to forskellige måder at evaluerer en given model
Læs mereSommeren 2001, opgave 1
Sommeren 2001, opgave 1 Vi antager at k 3, da det ellers er uklart hvordan trekanterne kan sættes sammen i en kreds. Vi ser nu at for hver trekant er der en knude i kredsen, og en spids. Derfor er n =
Læs mereVelkommen. Test dit eget DNA med PCR. Undervisningsdag på DTU Systembiologi. Undervisere:
Velkommen Test dit eget DNA med PCR Undervisningsdag på DTU Systembiologi Undervisere: Hvem er I? 2 DTU Systembiologi, Danmarks Tekniske Universitet Hvilke baser indgår i DNA? A. Adenin, Guanin, Cytosin,
Læs mereGrådige algoritmer. Et generelt algoritme-konstruktionsprincip ( paradigme ) for optimeringsproblemer.
Grådige algoritmer Grådige algoritmer Et generelt algoritme-konstruktionsprincip ( paradigme ) for optimeringsproblemer. Grådige algoritmer Et generelt algoritme-konstruktionsprincip ( paradigme ) for
Læs mereBRP Sortering og søgning. Hægtede lister
BRP 18.10.2006 Sortering og søgning. Hægtede lister 1. Opgaver 2. Selection sort (udvælgelsessortering) 3. Kompleksitetsanalyse 4. Merge sort (flettesortering) 5. Binær søgning 6. Hægtede lister 7. Øvelser:
Læs mereOrienterede grafer. Orienterede grafer. Orienterede grafer. Orienterede grafer
Philip Bille Orienteret graf. Mængde af knuder forbundet parvis med orienterede kanter. deg + (7) =, deg - (7) = Lemma. v V deg - (v) = v V deg + (v) = m. Bevis. Hver kant har netop en startknude og slutknude.
Læs mereINSTITUT FOR DATALOGI, AARHUS UNIVERSITET
INSTITUT FOR DTLOGI, RHUS UNIVERSITET Science and Technology EKSEN lgoritmer og Datastrukturer (00-ordning) ntal sider i opgavesættet (incl. forsiden): 11 (elleve) Eksamensdag: Torsdag den 1. juni 01,
Læs mereDanmarks Tekniske Universitet
side af sider Danmarks Tekniske Universitet Skriftlig prøve, den 6. maj 0. Kursusnavn: Algoritmer og datastrukturer Kursus nr. 06. Tilladte hjælpemidler: Skriftlige hjælpemidler. Varighed: timer Vægtning
Læs mereEt generelt algoritme-konstruktionsprincip ( paradigme ) for optimeringsproblemer. Ideen er simpel:
Grådige algoritmer Grådige algoritmer Et generelt algoritme-konstruktionsprincip ( paradigme ) for optimeringsproblemer. Ideen er simpel: Opbyg løsningen skridt for skridt ved hele tiden af vælge lige
Læs mereBiologi opgave Opsamling: Cellebiologi (Bioanalytiker modul3)
1 Delphine Bonneau Biologi opgave Opsamling: Cellebiologi 1-6 Pelle har spist en kæmpe stor kage, og efterfølgende stiger hans blodsukker. Derfor sender kroppen besked til de endokrine kirtler i bugspytkirtlen
Læs mereAnalyse af algoritmer
Analyse af algoritmer Analyse af algoritmer Køretid Pladsforbrug Asymptotisk notation O, Θ og Ω-notation. Eksperimentiel analyse af algoritmer Philip Bille Analyse af algoritmer Analyse af algoritmer Køretid
Læs mere28 Algoritmedesign. Noter. PS1 -- Algoritmedesign
28 Algoritmedesign. Algoritmeskabelon for Del og Hersk. Eksempler på Del og Hersk algoritmer. Binær søgning i et ordnet array. Sortering ved fletning og Quicksort. Maksimal delsums problem. Tætteste par
Læs mereVelkommen. Test dit eget DNA med PCR. Undervisningsdag på DTU Systembiologi. Undervisere: Sebastian, Louise og Ana
Velkommen Test dit eget DNA med PCR Undervisningsdag på DTU Systembiologi Undervisere: Sebastian, Louise og Ana Hvem er I? 2 DTU Systembiologi, Danmarks Tekniske Universitet Dagens program 9:00 10:00 Introduktion
Læs mereMm7: A little bit more about sorting - and more times for exercises - November 4, 2008
Algorithms and Architectures I Rasmus Løvenstein Olsen (RLO), Jimmy Jessen Nielsen (JJE) Mm: A little bit more about sorting - and more times for exercises - November 4, 2008 1 Algorithms and Architectures
Læs mereOrienterede grafer. Introduktion Repræsentation Søgning Topologisk sortering og DAGs Stærke sammenhængskomponenter Implicitte grafer.
Orienterede grafer Introduktion Repræsentation Søgning Topologisk sortering og DAGs Stærke sammenhængskomponenter Implicitte grafer Philip Bille Orienterede grafer Introduktion Repræsentation Søgning Topologisk
Læs mereGeneious en manual til elevbrug
REGN MED BIOLOGI SUPPLERENDE MATERIALE (4.3) Geneious en manual til elevbrug Indhold INTRODUKTION TIL GENEIOUS... 2 DATABASERNE HOS NCBI... 2 ORGANISÉR PROJEKTET... 3 SØGNING... 3 UDVIDET SØGNING... 4
Læs mereHashing. Ordbøger Hægtet hashing Hashfunktioner Lineær probering. Philip Bille
Hashing Ordbøger Hægtet hashing Hashfunktioner Lineær probering Philip Bille Hashing Ordbøger Hægtet hashing Hashfunktioner Lineær probering Ordbøger Ordbøger. Vedligehold en dynamisk mængde S af elementer.
Læs mereProgrammering og Problemløsning, 2017
Programmering og Problemløsning, 2017 Rekursion Towers of Hanoi og Liniegrafik Martin Elsman Datalogisk Institut Københavns Universitet DIKU 13. Oktober, 2017 Martin Elsman (DIKU) Programmering og Problemløsning,
Læs mereGrådige algoritmer. Et generelt algoritme-konstruktionsprincip ( paradigme ) for optimeringsproblemer.
Grådige algoritmer Grådige algoritmer Et generelt algoritme-konstruktionsprincip ( paradigme ) for optimeringsproblemer. Grådige algoritmer Et generelt algoritme-konstruktionsprincip ( paradigme ) for
Læs mereSUBS_BACLE 1 0 ELYA_BACHD 1 MRQSLKVMVLSTVALLFMANPAAASEEKKEYLIVVEPEEVSAQSVEESYD 50
Svar til Parvis Alignment øvelsen - Af: Rasmus Wernersson Q1: FASTA format. Q2: # Length: 361 # Identity: 176/361 (48.8%) # Similarity: 214/361 (59.3%) # Gaps: 92/361 (25.5%) # Score: 916.0 SUBS_BACLE
Læs mereDanmarks Tekniske Universitet
Eksamen 02105, F14 side 1 af 14 Danmarks Tekniske Universitet Skriftlig prøve, den 22. maj 2014. Kursusnavn: Algoritmer og datastrukturer 1 Kursusnummer: 02105 Hjælpemidler: Skriftlige hjælpemidler. Det
Læs mereat du trænes i at genkende aminosyrer i en simpel proteinstruktur (pentapeptid = lille protein bestående af 5 (penta) aminosyrer)
Elevvejledning til det Virtuelle Kræftlaboratorium Det Virtuelle Kræftlaboratorium stiller krav til en grundig forståelse af det centrale dogme inden for molekylærbiologien, hvordan DNA oversættes til
Læs mereAlgoritmer og invarianter
Algoritmer og invarianter Iterative algoritmer Algoritmen er overordnet set een eller flere while eller for-løkker. Iterative algoritmer Algoritmen er overordnet set een eller flere while eller for-løkker.
Læs mereSkriftlig Eksamen Algoritmer og Datastrukturer (DM507)
Skriftlig Eksamen Algoritmer og Datastrukturer (DM507) Institut for Matematik og Datalogi Syddansk Universitet, Odense Mandag den 7. juni 00, kl. 9 Alle sædvanlige hjælpemidler (lærebøger, notater, osv.)
Læs mereDanmarks Tekniske Universitet
side af sider Danmarks Tekniske Universitet Skriftlig prøve, den. maj 00. Kursusnavn Algoritmer og datastrukturer Kursus nr. 06. Tilladte hjælpemidler: Alle hjælpemidler. Vægtning af opgaverne: Opgave
Læs mereKorteste veje i vægtede grafer. Længde af sti = sum af vægte af kanter på sti.
Korteste veje Korteste veje i vægtede grafer Længde af sti = sum af vægte af kanter på sti. Korteste veje i vægtede grafer Længde af sti = sum af vægte af kanter på sti. δ(u, v) = længden af en korteste
Læs mereNy teknologi til analyse af vores gener ændrer måden, vi forebygger og behandler sygdom på. Nye markedsmuligheder for Exiqon
Ny teknologi til analyse af vores gener ændrer måden, vi forebygger og behandler sygdom på Nye markedsmuligheder for Exiqon De seneste års store teknologiske gennembrud har gjort, at vi i dag nemt og økonomisk
Læs mereNY TEKNOLOGI TIL ANALYSE AF VORES GENER ÆNDRER MÅDEN VI FOREBYGGER OG BEHANDLER SYGDOM PÅ NYE MARKEDSMULIGHEDER FOR EXIQON
NY TEKNOLOGI TIL ANALYSE AF VORES GENER ÆNDRER MÅDEN VI FOREBYGGER OG BEHANDLER SYGDOM PÅ NYE MARKEDSMULIGHEDER FOR EXIQON De sidste 5 års store teknologiske gennembrud har gjort, at vi i dag nemt og økonomisk
Læs mereDanmarks Tekniske Universitet
side af 2 sider Danmarks Tekniske Universitet Skriftlig prøve, den 23. maj 20. Kursusnavn: Algoritmer og datastrukturer I Kursus nr. 0205. Varighed: 4 timer Tilladte hjælpemidler: Alle skriftlige hjælpemidler.
Læs mereINSTITUT FOR DATALOGI, AARHUS UNIVERSITET
INSTITUT FOR DATALOGI, AARHUS UNIVERSITET Science and Technology EKSAMEN Antal sider i opgavesættet (incl. forsiden): 6 (seks) Eksamensdag: Fredag den 22. juni 2012, kl. 9.00-13.00 Eksamenslokale: Finlandsgade
Læs mereGrådige algoritmer. Et generelt algoritme-konstruktionsprincip ( paradigme ) for optimeringsproblemer.
Grådige algoritmer Grådige algoritmer Et generelt algoritme-konstruktionsprincip ( paradigme ) for optimeringsproblemer. Grådige algoritmer Et generelt algoritme-konstruktionsprincip ( paradigme ) for
Læs mereINSTITUT FOR DATALOGI, AARHUS UNIVERSITET
INSTITUT FOR ATALOGI, AARHUS UNIVERSITET Science and Technology EKSAMEN Algoritmer og atastrukturer (00-ordning) Antal sider i opgavesættet (incl. forsiden): (elleve) Eksamensdag: Fredag den. august 0,
Læs mereINSTITUT FOR DATALOGI, AARHUS UNIVERSITET
STTUT FR DTG, RUS UVERSTET Science and Technology ESE ntal sider i opgavesættet (incl. forsiden): (elleve) Eksamensdag: Fredag den. juni 0, kl. 9.00-.00 Tilladte medbragte hjælpemidler: lle sædvanlige
Læs mereKorteste veje i vægtede grafer. Længde af sti = sum af vægte af kanter på sti.
Korteste veje Korteste veje i vægtede grafer Længde af sti = sum af vægte af kanter på sti. Korteste veje i vægtede grafer Længde af sti = sum af vægte af kanter på sti. δ(u, v) = længden af en korteste
Læs mereBinære søgetræer. Binære søgetræer. Nærmeste naboer. Nærmeste nabo
Philip Bille er. Vedligehold en dynamisk mængde S af elementer. Hvert element har en nøgle x.key og satellitdata x.data. operationer. PREDECESSOR(k): returner element x med største nøgle k. SUCCESSOR(k):
Læs mere