Evolutionstræer (Phylogenetic trees)

Størrelse: px
Starte visningen fra side:

Download "Evolutionstræer (Phylogenetic trees)"

Transkript

1 BM forelæsning d november 00 Referat af Claus Skovgaard Evolutionstræer (Phylogenetic trees) Baseres på hvor meget de forskellige arter ligner hinanden og hvordan man tror udviklingen har forløbet menneske chimpanse gorilla orangutang gibbon Man har længe forsket i dette, og hvor man tidligere baserede lighederne på den fysiske lighed, har DA tilføjet ekstra og mere præcis information om sammenhængene imellem arter Man kan dog ikke være sikker på, at finder man et gen, som optræder i de arter man kigger på, og så laver et evolutionstræ for det gen, at det så svarer nøjagtigt til artstræet Der kan ske duplikeringer af gener, men det ene gen ofte blot går til igen og udvikler sig til et pseudo-gen Også bakterier kan overføre gener fra en art til en anden Tegning over udvikling Somme tider tegner man gen-træet inde i artstræet Eksempel med arter: : duplikation : specifikation A B C paraloger ortologer latteral transfer

2 Evolutionstræer og de sammenhænge der kan udledes kan ofte være meget nyttige i bla udvikling af medicin Vi er interesseret i træers topologi og kantlængder Ikke alle træ-algoritmer bestemmer en rod, men fortæller dog stadig om sammenhænge Der findes dog algoritmer som efterfølgende kan bestemme roden ved hjælp af forskellige tekninkker Evolutionstræer er som oftest binære træer, og med blade kan vi sige følgende: Med rod Uden rod - interne knuder - interne knuder - kanter - kanter Vi definerer: U : # binære træer uden rod R : # binære træer med rod Vi har så at: U = U = U = U = U = U - (-) = (-)!! R = (-) U = (-)!! Det ses at der er mange muligheder, så vi må finde en mere effektiv måde at konstruere evolutionstræerne på Der findes klasser af metoder: Aftstandsbaserede Ser på hvor forskellige de er (sekvens af tegn/mængde af egenskaber) o UPGMA o eighbour-joining Sekvensbaserede Mål for hvor godt træet er og maksimerer derud fra o Parsimony Probabilistiske o Maksimere sandsynligheden for træet er korrekt, P(T S) o Maksimere likelihood, P(S T)

3 Afstandsbaserede metoder sekvenser Evolutionær afstand Eks Jukes-Cantor d = log( f ) Hvor mange positioner er forskellige: x i = abcd x j = accb UPGMA (Unweighted Pair Group Method using Arithmetic averages) Algoritmen ligner Kruskal Man opbevarer disjunkte mængder af knuder, kaldet klynger Man er stadig interesseret i at finde de klynger der er tættest på hinanden, men er til forskel fra Kruskal defineret ud fra den gennemsnitlige afstand af alle muligheder I Kruskal oprettes der ikke nye knuder, hvorfor heller ikke alle de oprindelige knuder bliver til blade (som i UPGMA) Man starter ud med bladene ( blade) Dem som er tættest på hinanden bliver sat sammen og den nydannede knude indsættes i tabellen og afstandene for den regnes ud til alle andre punkter

4 + + + Evolutionær afstand Afstandstabel d + d d + = ( ) + Slet række og som ikke længere skal bruges + u er vi så færdige med at bruge og og de kan fjernes fra tabellen Algoritme (uden detaljer) For i = to C i = {x i } h j = 0 C = {C i,,c } For k = - to - C i og C j : min d C k = C i C j Tilføj knude k som gøres forælder af knude i og j C = (C {C k }) {C i,c j } For hvert C C d kl = (d il C i +d jl C j )/ C k h k = d kl / Molekylærklokken (molecular clock) Teorien om at udviklingen altid sker i samme fart Alle stilængder fra en knude v til et blad under v er ens: v ~ > x = v ~ > y x v y Ultrametriske afstande d d = d ik jk > 0 k i j Afstande: : k til j : k til i : i til j

5 Molekylærklokken ikke-negative ultrametriske afstande additivitet Eksempel på at det ikke gælder den anden vej (additivitet > ultrametriske afstande): d = d = 7 d = 9 d = ½ (d + d d ) = ½ (7+9 ) = 6 d = ½ (d + d d ) = Eksempel på et træ som det ser ud i virkeligheden og som UPGMA vil fejlkonstruere Det af UPGMA (fejlagtigt) konstruerede træ er vist til højre for det virkelige træ eighbour-joining D = d ri = ( r + r ) i k = d j Algoritme For i = to C i = {x i } C = {C i,, C } For k = + to - C i og C j : min D C k = C i C j Tilføj knude k som gøres forælder af knude i og j C = (C C k ) {C i, C j } For hvert C C d kl = ½ (dil + ri rj) d ki = ½ (d + r i r j ) d kj = d d ki

6 Indsæt en kant mellem de to knuder, der svarer til de to klynger, der er tilbage i C T l( e) Virker hvis afstande er næsten additive som er defineret: max{ d d } min{ } Med næsten additiv menes altså at afstandene næsten passer med træet Med tilsvarende afstand af d i træet e T T d menes den eighbour-joining bestemmer ikke hvor roden skal være Til at finde den, findes forskellige teknikker Bla kan brugeren hjælpe til ved at definere en out-group, som er en sekvens der ikke er i familie med resten Out-group en minder altså ikke om de andre og vil være den sidste der bliver tilføjet træet fordi den har den største afstand Roden vil bedst blive placeret på den kant som fører til denne out-group 6

Prioritetskøer og hobe. Philip Bille

Prioritetskøer og hobe. Philip Bille Prioritetskøer og hobe Philip Bille Plan Prioritetskøer Træer Hobe Repræsentation Prioritetskøoperationer Konstruktion af hob Hobsortering Prioritetskøer Prioritetskø Vedligehold en dynamisk mængde S af

Læs mere

Forén og find. Introduktion Hurtig find Hurtig forening Vægtet forening Stikompression Dynamiske sammenhængskomponenter.

Forén og find. Introduktion Hurtig find Hurtig forening Vægtet forening Stikompression Dynamiske sammenhængskomponenter. Forén og find Introduktion Hurtig find Hurtig forening Vægtet forening Stikompression Dynamiske sammenhængskomponenter Philip Bille Forén og find Introduktion Hurtig find Hurtig forening Vægtet forening

Læs mere

Danmarks Tekniske Universitet

Danmarks Tekniske Universitet side af sider Danmarks Tekniske Universitet Skriftlig prøve, den 6. maj 0. Kursusnavn: Algoritmer og datastrukturer I Kursus nr. 005. Tilladte hjælpemidler: Skriftlige hjælpemidler. Varighed: timer Vægtning

Læs mere

Algoritmeanalyse. Øvre grænse for algoritme. Øvre grænse for problem. Nedre grænse for problem. Identificer essentiel(le) operation(er)

Algoritmeanalyse. Øvre grænse for algoritme. Øvre grænse for problem. Nedre grænse for problem. Identificer essentiel(le) operation(er) Algoritmeanalyse Identificer essentiel(le) operation(er) Øvre grænse for algoritme Find øvre grænse for antallet af gange de(n) essentielle operation(er) udføres. Øvre grænse for problem Brug øvre grænse

Læs mere

Mindste udspændende træ. Mindste udspændende træ. Introduktion. Introduktion

Mindste udspændende træ. Mindste udspændende træ. Introduktion. Introduktion Philip Bille Introduktion (MST). Udspændende træ af minimal samlet vægt. Introduktion (MST). Udspændende træ af minimal samlet vægt. 0 0 Graf G Ikke sammenhængende Introduktion (MST). Udspændende træ af

Læs mere

Danmarks Tekniske Universitet

Danmarks Tekniske Universitet side af sider Danmarks Tekniske Universitet Skriftlig prøve, den 6. maj 0. Kursusnavn: Algoritmer og datastrukturer Kursus nr. 06. Tilladte hjælpemidler: Skriftlige hjælpemidler. Varighed: timer Vægtning

Læs mere

Danmarks Tekniske Universitet

Danmarks Tekniske Universitet Eksamen 02105, F14 side 1 af 14 Danmarks Tekniske Universitet Skriftlig prøve, den 22. maj 2014. Kursusnavn: Algoritmer og datastrukturer 1 Kursusnummer: 02105 Hjælpemidler: Skriftlige hjælpemidler. Det

Læs mere

Danmarks Tekniske Universitet

Danmarks Tekniske Universitet Eksamen 005, F side af sider Danmarks Tekniske Universitet Skriftlig prøve, den 6. maj 0. Kursusnavn: Algoritmer og datastrukturer I Kursus nr. 005. Tilladte hjælpemidler: Skriftlige hjælpemidler. Varighed:

Læs mere

Danmarks Tekniske Universitet

Danmarks Tekniske Universitet Eksamen 0205, Forår 205 side af 5 Danmarks Tekniske Universitet Skriftlig prøve, den 22. maj 205. Kursusnavn: Algoritmer og datastrukturer Kursusnummer: 0205 Hjælpemidler: Skriftlige hjælpemidler. Det

Læs mere

Skriftlig Eksamen Algoritmer og Datastrukturer (DM507)

Skriftlig Eksamen Algoritmer og Datastrukturer (DM507) Skriftlig Eksamen Algoritmer og Datastrukturer (DM507) Institut for Matematik og Datalogi Syddansk Universitet, Odense Onsdag den 0. juni 009, kl. 9 Alle sædvanlige hjælpemidler (lærebøger, notater, osv.)

Læs mere

Grådige algoritmer. Et algoritme-konstruktionsprincip ( paradigme ) for optimeringsproblemer.

Grådige algoritmer. Et algoritme-konstruktionsprincip ( paradigme ) for optimeringsproblemer. Grådige algoritmer Grådige algoritmer Et algoritme-konstruktionsprincip ( paradigme ) for optimeringsproblemer. Grådige algoritmer Et algoritme-konstruktionsprincip ( paradigme ) for optimeringsproblemer.

Læs mere

Skriftlig Eksamen Algoritmer og Datastrukturer (dads)

Skriftlig Eksamen Algoritmer og Datastrukturer (dads) Skriftlig Eksamen Algoritmer og Datastrukturer (dads) Datalogisk Institut Aarhus Universitet Mandag den 27. maj 2002, kl. 9.00 13.00 Opgave 1 (25%) Denne opgave handler om multiplikation af positive heltal.

Læs mere

Binære søgetræer. Binære søgetræer. Nærmeste naboer. Nærmeste nabo

Binære søgetræer. Binære søgetræer. Nærmeste naboer. Nærmeste nabo Philip Bille er. Vedligehold en dynamisk mængde S af elementer. Hvert element har en nøgle x.key og satellitdata x.data. operationer. PREDECESSOR(k): returner element x med største nøgle k. SUCCESSOR(k):

Læs mere

UPGMA-metoden eksempel truede tigre

UPGMA-metoden eksempel truede tigre REGN MED BIOLOGI SUPPLERENDE MATERIALE (4.5) UPGMA-metoden eksempel truede tigre UPGMA står for Unweighted Pair Group Method with Arithmetic mean og er en metode til at udregne grenlængder i stamtræer

Læs mere

22 Hobe. Noter. PS1 -- Hobe. Binære hobe. Minimum-hob og maximum-hob. Den abstrakte datatype minimum-hob. Opbygning af hobe. Operationen siv-ned.

22 Hobe. Noter. PS1 -- Hobe. Binære hobe. Minimum-hob og maximum-hob. Den abstrakte datatype minimum-hob. Opbygning af hobe. Operationen siv-ned. 22 Hobe. Binære hobe. Minimum-hob og maximum-hob. Den abstrakte datatype minimum-hob. Opbygning af hobe. Operationen siv-ned. Indsættelse i hobe. Sletning af minimalt element i hobe. Repræsentation. 327

Læs mere

Definition : Et træ er en sammenhængende ikke-orienteret graf uden simple kredse. Sætning : En ikke-orienteret graf er et træ hvis og kun hvis der er

Definition : Et træ er en sammenhængende ikke-orienteret graf uden simple kredse. Sætning : En ikke-orienteret graf er et træ hvis og kun hvis der er Definition : Et træ er en sammenhængende ikke-orienteret graf uden simple kredse. Sætning : En ikke-orienteret graf er et træ hvis og kun hvis der er en unik simpel vej mellem ethvert par af punkter i

Læs mere

Binære søgetræer. Binære søgetræer. Nærmeste naboer. Nærmeste nabo

Binære søgetræer. Binære søgetræer. Nærmeste naboer. Nærmeste nabo Philip Bille Nærmeste naboer. Vedligehold en dynamisk mængde S af elementer. Hvert element har en nøgle key[] og satellitdata data[]. operationer. PREDECESSOR(k): returner element med største nøgle k.

Læs mere

Sortering. Eksempel: De n tal i sorteret orden

Sortering. Eksempel: De n tal i sorteret orden Sortering 1 / 34 Sortering Input: Output: Eksempel: n tal De n tal i sorteret orden 6, 2, 9, 4, 5, 1, 4, 3 1, 2, 3, 4, 4, 5, 9 2 / 34 Sortering Input: Output: Eksempel: n tal De n tal i sorteret orden

Læs mere

Algoritmer og datastrukturer Course No. 02105 Cheat Sheet 2012. May 15, 2012

Algoritmer og datastrukturer Course No. 02105 Cheat Sheet 2012. May 15, 2012 Algoritmer og datastrukturer Course No. 02105 Cheat Sheet 2012 May 15, 2012 1 CONTENTS 2012 CONTENTS Contents 1 Kompleksitet 3 1.1 Køretid................................................ 3 1.2 Asymptotisk

Læs mere

Danmarks Tekniske Universitet

Danmarks Tekniske Universitet side af sider Danmarks Tekniske Universitet Skriftlig prøve, den. maj 00. Kursusnavn Algoritmer og datastrukturer Kursus nr. 06. Tilladte hjælpemidler: Alle hjælpemidler. Vægtning af opgaverne: Opgave

Læs mere

Danmarks Tekniske Universitet

Danmarks Tekniske Universitet side af 2 sider Danmarks Tekniske Universitet Skriftlig prøve, den 2. maj 200. Kursusnavn Algoritmer og datastrukturer Kursus nr. 02326. Tilladte hjælpemidler: Alle hjælpemidler. Vægtning af opgaverne:

Læs mere

Sortering. Eksempel: De n tal i sorteret orden

Sortering. Eksempel: De n tal i sorteret orden Sortering 1 / 32 Sortering Input: Output: Eksempel: n tal De n tal i sorteret orden 6, 2, 9, 4, 5, 1, 4, 3 1, 2, 3, 4, 4, 5, 9 2 / 32 Sortering Input: Output: Eksempel: n tal De n tal i sorteret orden

Læs mere

REGNSKOVENS PLANTER KÆMPERNE

REGNSKOVENS PLANTER KÆMPERNE REGNSKOVENS PLANTER KÆMPERNE Regnskovens træer, overliggerne, kan blive op til 80 meter høje. Altså højere end både Rundetårn og tårnet i København ZOO! Men hvor høje bliver træerne i Danmark egentlig?

Læs mere

Skriftlig Eksamen DM507 Algoritmer og Datastrukturer

Skriftlig Eksamen DM507 Algoritmer og Datastrukturer Skriftlig Eksamen DM507 Algoritmer og Datastrukturer Institut for Matematik og Datalogi Syddansk Universitet, Odense Tirsdag den 24. juni 2014, kl. 10:00 14:00 Besvarelsen skal afleveres elektronisk. Se

Læs mere

I denne opgave arbejder vi med følgende matematiske begreber:

I denne opgave arbejder vi med følgende matematiske begreber: I denne opgave arbejder vi med følgende matematiske begreber: En meter: 1 m. En kvadratmeter: 1 m. 1 m 2 1 m. En kubikmeter: 1 m 3 Radius-beregning af træet Find omkredsen af træet, mål i brysthøjde. Ca.

Læs mere

Skriftlig Eksamen Algoritmer og Datastrukturer (dads)

Skriftlig Eksamen Algoritmer og Datastrukturer (dads) Skriftlig Eksamen Algoritmer og Datastrukturer (dads) Datalogisk Institut Aarhus Universitet Tirsdag den 27. maj 2003, kl. 9.00 3.00 Opgave (25%) For konstanten π = 3.4592... gælder identiteten π 2 6 =

Læs mere

DM507 Algoritmer og datastrukturer

DM507 Algoritmer og datastrukturer DM507 Algoritmer og datastrukturer Forår 2012 Projekt, del II Institut for matematik og datalogi Syddansk Universitet 15. marts, 2012 Dette projekt udleveres i tre dele. Hver del har sin deadline, således

Læs mere

Skriftlig Eksamen DM507 Algoritmer og Datastrukturer

Skriftlig Eksamen DM507 Algoritmer og Datastrukturer Skriftlig Eksamen DM507 Algoritmer og Datastrukturer Institut for Matematik og Datalogi Syddansk Universitet, Odense Mandag den 6. juni 2016, kl. 15:00 19:00 Besvarelsen skal afleveres elektronisk. Se

Læs mere

DM507 Algoritmer og datastrukturer

DM507 Algoritmer og datastrukturer DM507 Algoritmer og datastrukturer Forår 2018 Projekt, del II Institut for matematik og datalogi Syddansk Universitet 20. marts, 2019 Dette projekt udleveres i tre dele. Hver del har sin deadline, således

Læs mere

Om binære søgetræer i Java

Om binære søgetræer i Java Om binære søgetræer i Java Mads Rosendahl 7. november 2002 Resumé En fix måde at gemme data på er i en træstruktur. Måden er nyttig hvis man får noget data ind og man gerne vil have at det gemt i en sorteret

Læs mere

Sammenhængskomponenter i grafer

Sammenhængskomponenter i grafer Sammenhængskomponenter i grafer Ækvivalensrelationer Repetition: En relation R på en mængde S er en delmængde af S S. Når (x, y) R siges x at stå i relation til y. Ofte skrives x y, og relationen selv

Læs mere

Skruedyrenes evolution

Skruedyrenes evolution Skruedyrenes evolution Materialer: 8 forskellige søm og skruer per hold. Formål: At tegne et slægtskabstræ udfra morfologiske karaktertræk Når arterne er blevet indsamlet og identificeret, skal de systematiseres.

Læs mere

DM507 Algoritmer og datastrukturer

DM507 Algoritmer og datastrukturer DM507 Algoritmer og datastrukturer Forår 2018 Projekt, del II Institut for matematik og datalogi Syddansk Universitet 13. marts, 2018 Dette projekt udleveres i tre dele. Hver del har sin deadline, således

Læs mere

Løs til optimalitet i eksponentiel tid Find tilnærmet løsning i polynomiel tid

Løs til optimalitet i eksponentiel tid Find tilnærmet løsning i polynomiel tid 6 april Løsning af N P -hårde problemer Løs til optimalitet i eksponentiel tid Find tilnærmet løsning i polynomiel tid Oversigt Grænseværdier (repetition) Branch-and-bound algoritmens komponenter Eksempler

Læs mere

Immunologisk bioinformatik

Immunologisk bioinformatik Immunologisk bioinformatik Øvelsesvejledning Introduktion til øvelsen Når man i dagligdagen taler om influenza, bliver virussen ofte forbundet med forbigående og ufarlig sygdom. Som regel har mennesker

Læs mere

02105 Eksamensnoter. Lasse Herskind S maj Sortering 3

02105 Eksamensnoter. Lasse Herskind S maj Sortering 3 02105 Eksamensnoter Lasse Herskind S153746 12. maj 2017 Indhold 1 Sortering 3 2 Analyse af algoritme 4 2.1 Køretid.......................................... 4 2.2 Pladsforbrug.......................................

Læs mere

Sortering. De n tal i sorteret orden. Eksempel: Kommentarer:

Sortering. De n tal i sorteret orden. Eksempel: Kommentarer: Sortering Sortering Input: Output: n tal De n tal i sorteret orden Eksempel: Kommentarer: 6, 2, 9, 4, 5, 1, 4, 3 1, 2, 3, 4, 4, 5, 9 Sorteret orden kan være stigende eller faldende. Vi vil i dette kursus

Læs mere

DM507 Algoritmer og datastrukturer

DM507 Algoritmer og datastrukturer DM507 Algoritmer og datastrukturer Forår 2019 Projekt, del III Institut for matematik og datalogi Syddansk Universitet 10. april, 2019 Dette projekt udleveres i tre dele. Hver del har sin deadline, således

Læs mere

INSTITUT FOR DATALOGI, AARHUS UNIVERSITET

INSTITUT FOR DATALOGI, AARHUS UNIVERSITET INSTITUT FOR DTOI, RUS UNIVERSITET Science and Technology ESEN lgoritmer og Datastrukturer (00-ordning) ntal sider i opgavesættet (incl. forsiden): (elleve) Eksamensdag: Fredag den. juni 0, kl. 9.00-.00

Læs mere

DM507 Algoritmer og datastrukturer

DM507 Algoritmer og datastrukturer DM507 Algoritmer og datastrukturer Forår 2017 Projekt, del III Institut for matematik og datalogi Syddansk Universitet 6. april, 2017 Dette projekt udleveres i tre dele. Hver del har sin deadline, således

Læs mere

Rekonstruktion af evolutionære træer vha. eksperimenter

Rekonstruktion af evolutionære træer vha. eksperimenter Rekonstruktion af evolutionære træer vha. eksperimenter Casper Lund Thomsen 19993647 Mads Laursen 19993727 Vejleder: Christian Nørgaard Storm Pedersen Datalogisk

Læs mere

Søgning og Sortering. Philip Bille

Søgning og Sortering. Philip Bille Søgning og Sortering Philip Bille Plan Søgning Linæer søgning Binær søgning Sortering Indsættelsesortering Flettesortering Søgning Søgning 1 4 7 12 16 18 25 28 31 33 36 42 45 47 50 1 2 3 4 5 6 7 8 9 10

Læs mere

Vægtede grafer. I en vægtet graf har enhver kant tilknyttet en numerisk værdi, kaldet kantens vægt

Vægtede grafer. I en vægtet graf har enhver kant tilknyttet en numerisk værdi, kaldet kantens vægt Korteste veje 1 Vægtede grafer HNL I en vægtet graf har enhver kant tilknyttet en numerisk værdi, kaldet kantens vægt Vægte kan repræsentere afstande, omkostninger, o.s.v. Eksempel: I en flyrutegraf repræsenterer

Læs mere

Reeksamen i Diskret Matematik

Reeksamen i Diskret Matematik Reeksamen i Diskret Matematik Første Studieår ved Det Teknisk-Naturvidenskabelige Fakultet Torsdag den 9. august, 202. Kl. 9-3. Nærværende eksamenssæt består af 9 nummererede sider med ialt 2 opgaver.

Læs mere