Evolutionstræer (Phylogenetic trees)
|
|
|
- Julius Groth
- 6 år siden
- Visninger:
Transkript
1 BM forelæsning d november 00 Referat af Claus Skovgaard Evolutionstræer (Phylogenetic trees) Baseres på hvor meget de forskellige arter ligner hinanden og hvordan man tror udviklingen har forløbet menneske chimpanse gorilla orangutang gibbon Man har længe forsket i dette, og hvor man tidligere baserede lighederne på den fysiske lighed, har DA tilføjet ekstra og mere præcis information om sammenhængene imellem arter Man kan dog ikke være sikker på, at finder man et gen, som optræder i de arter man kigger på, og så laver et evolutionstræ for det gen, at det så svarer nøjagtigt til artstræet Der kan ske duplikeringer af gener, men det ene gen ofte blot går til igen og udvikler sig til et pseudo-gen Også bakterier kan overføre gener fra en art til en anden Tegning over udvikling Somme tider tegner man gen-træet inde i artstræet Eksempel med arter: : duplikation : specifikation A B C paraloger ortologer latteral transfer
2 Evolutionstræer og de sammenhænge der kan udledes kan ofte være meget nyttige i bla udvikling af medicin Vi er interesseret i træers topologi og kantlængder Ikke alle træ-algoritmer bestemmer en rod, men fortæller dog stadig om sammenhænge Der findes dog algoritmer som efterfølgende kan bestemme roden ved hjælp af forskellige tekninkker Evolutionstræer er som oftest binære træer, og med blade kan vi sige følgende: Med rod Uden rod - interne knuder - interne knuder - kanter - kanter Vi definerer: U : # binære træer uden rod R : # binære træer med rod Vi har så at: U = U = U = U = U = U - (-) = (-)!! R = (-) U = (-)!! Det ses at der er mange muligheder, så vi må finde en mere effektiv måde at konstruere evolutionstræerne på Der findes klasser af metoder: Aftstandsbaserede Ser på hvor forskellige de er (sekvens af tegn/mængde af egenskaber) o UPGMA o eighbour-joining Sekvensbaserede Mål for hvor godt træet er og maksimerer derud fra o Parsimony Probabilistiske o Maksimere sandsynligheden for træet er korrekt, P(T S) o Maksimere likelihood, P(S T)
3 Afstandsbaserede metoder sekvenser Evolutionær afstand Eks Jukes-Cantor d = log( f ) Hvor mange positioner er forskellige: x i = abcd x j = accb UPGMA (Unweighted Pair Group Method using Arithmetic averages) Algoritmen ligner Kruskal Man opbevarer disjunkte mængder af knuder, kaldet klynger Man er stadig interesseret i at finde de klynger der er tættest på hinanden, men er til forskel fra Kruskal defineret ud fra den gennemsnitlige afstand af alle muligheder I Kruskal oprettes der ikke nye knuder, hvorfor heller ikke alle de oprindelige knuder bliver til blade (som i UPGMA) Man starter ud med bladene ( blade) Dem som er tættest på hinanden bliver sat sammen og den nydannede knude indsættes i tabellen og afstandene for den regnes ud til alle andre punkter
4 + + + Evolutionær afstand Afstandstabel d + d d + = ( ) + Slet række og som ikke længere skal bruges + u er vi så færdige med at bruge og og de kan fjernes fra tabellen Algoritme (uden detaljer) For i = to C i = {x i } h j = 0 C = {C i,,c } For k = - to - C i og C j : min d C k = C i C j Tilføj knude k som gøres forælder af knude i og j C = (C {C k }) {C i,c j } For hvert C C d kl = (d il C i +d jl C j )/ C k h k = d kl / Molekylærklokken (molecular clock) Teorien om at udviklingen altid sker i samme fart Alle stilængder fra en knude v til et blad under v er ens: v ~ > x = v ~ > y x v y Ultrametriske afstande d d = d ik jk > 0 k i j Afstande: : k til j : k til i : i til j
5 Molekylærklokken ikke-negative ultrametriske afstande additivitet Eksempel på at det ikke gælder den anden vej (additivitet > ultrametriske afstande): d = d = 7 d = 9 d = ½ (d + d d ) = ½ (7+9 ) = 6 d = ½ (d + d d ) = Eksempel på et træ som det ser ud i virkeligheden og som UPGMA vil fejlkonstruere Det af UPGMA (fejlagtigt) konstruerede træ er vist til højre for det virkelige træ eighbour-joining D = d ri = ( r + r ) i k = d j Algoritme For i = to C i = {x i } C = {C i,, C } For k = + to - C i og C j : min D C k = C i C j Tilføj knude k som gøres forælder af knude i og j C = (C C k ) {C i, C j } For hvert C C d kl = ½ (dil + ri rj) d ki = ½ (d + r i r j ) d kj = d d ki
6 Indsæt en kant mellem de to knuder, der svarer til de to klynger, der er tilbage i C T l( e) Virker hvis afstande er næsten additive som er defineret: max{ d d } min{ } Med næsten additiv menes altså at afstandene næsten passer med træet Med tilsvarende afstand af d i træet e T T d menes den eighbour-joining bestemmer ikke hvor roden skal være Til at finde den, findes forskellige teknikker Bla kan brugeren hjælpe til ved at definere en out-group, som er en sekvens der ikke er i familie med resten Out-group en minder altså ikke om de andre og vil være den sidste der bliver tilføjet træet fordi den har den største afstand Roden vil bedst blive placeret på den kant som fører til denne out-group 6
Prioritetskøer og hobe. Philip Bille
Prioritetskøer og hobe Philip Bille Plan Prioritetskøer Træer Hobe Repræsentation Prioritetskøoperationer Konstruktion af hob Hobsortering Prioritetskøer Prioritetskø Vedligehold en dynamisk mængde S af
Forén og find. Introduktion Hurtig find Hurtig forening Vægtet forening Stikompression Dynamiske sammenhængskomponenter.
Forén og find Introduktion Hurtig find Hurtig forening Vægtet forening Stikompression Dynamiske sammenhængskomponenter Philip Bille Forén og find Introduktion Hurtig find Hurtig forening Vægtet forening
Danmarks Tekniske Universitet
side af sider Danmarks Tekniske Universitet Skriftlig prøve, den 6. maj 0. Kursusnavn: Algoritmer og datastrukturer I Kursus nr. 005. Tilladte hjælpemidler: Skriftlige hjælpemidler. Varighed: timer Vægtning
Algoritmeanalyse. Øvre grænse for algoritme. Øvre grænse for problem. Nedre grænse for problem. Identificer essentiel(le) operation(er)
Algoritmeanalyse Identificer essentiel(le) operation(er) Øvre grænse for algoritme Find øvre grænse for antallet af gange de(n) essentielle operation(er) udføres. Øvre grænse for problem Brug øvre grænse
Mindste udspændende træ. Mindste udspændende træ. Introduktion. Introduktion
Philip Bille Introduktion (MST). Udspændende træ af minimal samlet vægt. Introduktion (MST). Udspændende træ af minimal samlet vægt. 0 0 Graf G Ikke sammenhængende Introduktion (MST). Udspændende træ af
Danmarks Tekniske Universitet
side af sider Danmarks Tekniske Universitet Skriftlig prøve, den 6. maj 0. Kursusnavn: Algoritmer og datastrukturer Kursus nr. 06. Tilladte hjælpemidler: Skriftlige hjælpemidler. Varighed: timer Vægtning
Danmarks Tekniske Universitet
Eksamen 02105, F14 side 1 af 14 Danmarks Tekniske Universitet Skriftlig prøve, den 22. maj 2014. Kursusnavn: Algoritmer og datastrukturer 1 Kursusnummer: 02105 Hjælpemidler: Skriftlige hjælpemidler. Det
Danmarks Tekniske Universitet
Eksamen 005, F side af sider Danmarks Tekniske Universitet Skriftlig prøve, den 6. maj 0. Kursusnavn: Algoritmer og datastrukturer I Kursus nr. 005. Tilladte hjælpemidler: Skriftlige hjælpemidler. Varighed:
Danmarks Tekniske Universitet
Eksamen 0205, Forår 205 side af 5 Danmarks Tekniske Universitet Skriftlig prøve, den 22. maj 205. Kursusnavn: Algoritmer og datastrukturer Kursusnummer: 0205 Hjælpemidler: Skriftlige hjælpemidler. Det
Skriftlig Eksamen Algoritmer og Datastrukturer (DM507)
Skriftlig Eksamen Algoritmer og Datastrukturer (DM507) Institut for Matematik og Datalogi Syddansk Universitet, Odense Onsdag den 0. juni 009, kl. 9 Alle sædvanlige hjælpemidler (lærebøger, notater, osv.)
Grådige algoritmer. Et algoritme-konstruktionsprincip ( paradigme ) for optimeringsproblemer.
Grådige algoritmer Grådige algoritmer Et algoritme-konstruktionsprincip ( paradigme ) for optimeringsproblemer. Grådige algoritmer Et algoritme-konstruktionsprincip ( paradigme ) for optimeringsproblemer.
Skriftlig Eksamen Algoritmer og Datastrukturer (dads)
Skriftlig Eksamen Algoritmer og Datastrukturer (dads) Datalogisk Institut Aarhus Universitet Mandag den 27. maj 2002, kl. 9.00 13.00 Opgave 1 (25%) Denne opgave handler om multiplikation af positive heltal.
Binære søgetræer. Binære søgetræer. Nærmeste naboer. Nærmeste nabo
Philip Bille er. Vedligehold en dynamisk mængde S af elementer. Hvert element har en nøgle x.key og satellitdata x.data. operationer. PREDECESSOR(k): returner element x med største nøgle k. SUCCESSOR(k):
UPGMA-metoden eksempel truede tigre
REGN MED BIOLOGI SUPPLERENDE MATERIALE (4.5) UPGMA-metoden eksempel truede tigre UPGMA står for Unweighted Pair Group Method with Arithmetic mean og er en metode til at udregne grenlængder i stamtræer
22 Hobe. Noter. PS1 -- Hobe. Binære hobe. Minimum-hob og maximum-hob. Den abstrakte datatype minimum-hob. Opbygning af hobe. Operationen siv-ned.
22 Hobe. Binære hobe. Minimum-hob og maximum-hob. Den abstrakte datatype minimum-hob. Opbygning af hobe. Operationen siv-ned. Indsættelse i hobe. Sletning af minimalt element i hobe. Repræsentation. 327
Definition : Et træ er en sammenhængende ikke-orienteret graf uden simple kredse. Sætning : En ikke-orienteret graf er et træ hvis og kun hvis der er
Definition : Et træ er en sammenhængende ikke-orienteret graf uden simple kredse. Sætning : En ikke-orienteret graf er et træ hvis og kun hvis der er en unik simpel vej mellem ethvert par af punkter i
Binære søgetræer. Binære søgetræer. Nærmeste naboer. Nærmeste nabo
Philip Bille Nærmeste naboer. Vedligehold en dynamisk mængde S af elementer. Hvert element har en nøgle key[] og satellitdata data[]. operationer. PREDECESSOR(k): returner element med største nøgle k.
Sortering. Eksempel: De n tal i sorteret orden
Sortering 1 / 34 Sortering Input: Output: Eksempel: n tal De n tal i sorteret orden 6, 2, 9, 4, 5, 1, 4, 3 1, 2, 3, 4, 4, 5, 9 2 / 34 Sortering Input: Output: Eksempel: n tal De n tal i sorteret orden
Algoritmer og datastrukturer Course No. 02105 Cheat Sheet 2012. May 15, 2012
Algoritmer og datastrukturer Course No. 02105 Cheat Sheet 2012 May 15, 2012 1 CONTENTS 2012 CONTENTS Contents 1 Kompleksitet 3 1.1 Køretid................................................ 3 1.2 Asymptotisk
Danmarks Tekniske Universitet
side af sider Danmarks Tekniske Universitet Skriftlig prøve, den. maj 00. Kursusnavn Algoritmer og datastrukturer Kursus nr. 06. Tilladte hjælpemidler: Alle hjælpemidler. Vægtning af opgaverne: Opgave
Danmarks Tekniske Universitet
side af 2 sider Danmarks Tekniske Universitet Skriftlig prøve, den 2. maj 200. Kursusnavn Algoritmer og datastrukturer Kursus nr. 02326. Tilladte hjælpemidler: Alle hjælpemidler. Vægtning af opgaverne:
Sortering. Eksempel: De n tal i sorteret orden
Sortering 1 / 32 Sortering Input: Output: Eksempel: n tal De n tal i sorteret orden 6, 2, 9, 4, 5, 1, 4, 3 1, 2, 3, 4, 4, 5, 9 2 / 32 Sortering Input: Output: Eksempel: n tal De n tal i sorteret orden
REGNSKOVENS PLANTER KÆMPERNE
REGNSKOVENS PLANTER KÆMPERNE Regnskovens træer, overliggerne, kan blive op til 80 meter høje. Altså højere end både Rundetårn og tårnet i København ZOO! Men hvor høje bliver træerne i Danmark egentlig?
Skriftlig Eksamen DM507 Algoritmer og Datastrukturer
Skriftlig Eksamen DM507 Algoritmer og Datastrukturer Institut for Matematik og Datalogi Syddansk Universitet, Odense Tirsdag den 24. juni 2014, kl. 10:00 14:00 Besvarelsen skal afleveres elektronisk. Se
I denne opgave arbejder vi med følgende matematiske begreber:
I denne opgave arbejder vi med følgende matematiske begreber: En meter: 1 m. En kvadratmeter: 1 m. 1 m 2 1 m. En kubikmeter: 1 m 3 Radius-beregning af træet Find omkredsen af træet, mål i brysthøjde. Ca.
Skriftlig Eksamen Algoritmer og Datastrukturer (dads)
Skriftlig Eksamen Algoritmer og Datastrukturer (dads) Datalogisk Institut Aarhus Universitet Tirsdag den 27. maj 2003, kl. 9.00 3.00 Opgave (25%) For konstanten π = 3.4592... gælder identiteten π 2 6 =
DM507 Algoritmer og datastrukturer
DM507 Algoritmer og datastrukturer Forår 2012 Projekt, del II Institut for matematik og datalogi Syddansk Universitet 15. marts, 2012 Dette projekt udleveres i tre dele. Hver del har sin deadline, således
Skriftlig Eksamen DM507 Algoritmer og Datastrukturer
Skriftlig Eksamen DM507 Algoritmer og Datastrukturer Institut for Matematik og Datalogi Syddansk Universitet, Odense Mandag den 6. juni 2016, kl. 15:00 19:00 Besvarelsen skal afleveres elektronisk. Se
DM507 Algoritmer og datastrukturer
DM507 Algoritmer og datastrukturer Forår 2018 Projekt, del II Institut for matematik og datalogi Syddansk Universitet 20. marts, 2019 Dette projekt udleveres i tre dele. Hver del har sin deadline, således
Om binære søgetræer i Java
Om binære søgetræer i Java Mads Rosendahl 7. november 2002 Resumé En fix måde at gemme data på er i en træstruktur. Måden er nyttig hvis man får noget data ind og man gerne vil have at det gemt i en sorteret
Sammenhængskomponenter i grafer
Sammenhængskomponenter i grafer Ækvivalensrelationer Repetition: En relation R på en mængde S er en delmængde af S S. Når (x, y) R siges x at stå i relation til y. Ofte skrives x y, og relationen selv
Skruedyrenes evolution
Skruedyrenes evolution Materialer: 8 forskellige søm og skruer per hold. Formål: At tegne et slægtskabstræ udfra morfologiske karaktertræk Når arterne er blevet indsamlet og identificeret, skal de systematiseres.
DM507 Algoritmer og datastrukturer
DM507 Algoritmer og datastrukturer Forår 2018 Projekt, del II Institut for matematik og datalogi Syddansk Universitet 13. marts, 2018 Dette projekt udleveres i tre dele. Hver del har sin deadline, således
Løs til optimalitet i eksponentiel tid Find tilnærmet løsning i polynomiel tid
6 april Løsning af N P -hårde problemer Løs til optimalitet i eksponentiel tid Find tilnærmet løsning i polynomiel tid Oversigt Grænseværdier (repetition) Branch-and-bound algoritmens komponenter Eksempler
Immunologisk bioinformatik
Immunologisk bioinformatik Øvelsesvejledning Introduktion til øvelsen Når man i dagligdagen taler om influenza, bliver virussen ofte forbundet med forbigående og ufarlig sygdom. Som regel har mennesker
02105 Eksamensnoter. Lasse Herskind S maj Sortering 3
02105 Eksamensnoter Lasse Herskind S153746 12. maj 2017 Indhold 1 Sortering 3 2 Analyse af algoritme 4 2.1 Køretid.......................................... 4 2.2 Pladsforbrug.......................................
Sortering. De n tal i sorteret orden. Eksempel: Kommentarer:
Sortering Sortering Input: Output: n tal De n tal i sorteret orden Eksempel: Kommentarer: 6, 2, 9, 4, 5, 1, 4, 3 1, 2, 3, 4, 4, 5, 9 Sorteret orden kan være stigende eller faldende. Vi vil i dette kursus
DM507 Algoritmer og datastrukturer
DM507 Algoritmer og datastrukturer Forår 2019 Projekt, del III Institut for matematik og datalogi Syddansk Universitet 10. april, 2019 Dette projekt udleveres i tre dele. Hver del har sin deadline, således
INSTITUT FOR DATALOGI, AARHUS UNIVERSITET
INSTITUT FOR DTOI, RUS UNIVERSITET Science and Technology ESEN lgoritmer og Datastrukturer (00-ordning) ntal sider i opgavesættet (incl. forsiden): (elleve) Eksamensdag: Fredag den. juni 0, kl. 9.00-.00
DM507 Algoritmer og datastrukturer
DM507 Algoritmer og datastrukturer Forår 2017 Projekt, del III Institut for matematik og datalogi Syddansk Universitet 6. april, 2017 Dette projekt udleveres i tre dele. Hver del har sin deadline, således
Rekonstruktion af evolutionære træer vha. eksperimenter
Rekonstruktion af evolutionære træer vha. eksperimenter Casper Lund Thomsen 19993647 Mads Laursen 19993727 Vejleder: Christian Nørgaard Storm Pedersen Datalogisk
Søgning og Sortering. Philip Bille
Søgning og Sortering Philip Bille Plan Søgning Linæer søgning Binær søgning Sortering Indsættelsesortering Flettesortering Søgning Søgning 1 4 7 12 16 18 25 28 31 33 36 42 45 47 50 1 2 3 4 5 6 7 8 9 10
Vægtede grafer. I en vægtet graf har enhver kant tilknyttet en numerisk værdi, kaldet kantens vægt
Korteste veje 1 Vægtede grafer HNL I en vægtet graf har enhver kant tilknyttet en numerisk værdi, kaldet kantens vægt Vægte kan repræsentere afstande, omkostninger, o.s.v. Eksempel: I en flyrutegraf repræsenterer
Reeksamen i Diskret Matematik
Reeksamen i Diskret Matematik Første Studieår ved Det Teknisk-Naturvidenskabelige Fakultet Torsdag den 9. august, 202. Kl. 9-3. Nærværende eksamenssæt består af 9 nummererede sider med ialt 2 opgaver.
