Bioinformatik Open Source Software i biologiens tjeneste



Relaterede dokumenter
Immunologisk bioinformatik - et undervisningsprojekt til de danske gymnasier

27611 Eksamen Sommer 2007

Side 1 af 14. Eksamen: Bioinformatik It og Sundhed 27 Jan 2011 kl 9-13

Side 1 af 13. Eksamen: Bioinformatik It og Sundhed 27 Jan 2011 kl 9-13

1. Formål, fag og læringsmål

Danmarks Tekniske Universitet

Foreløbig godkendelse af Kandidatuddannelse i medicinsk bioinformatik

Danmarks Tekniske Universitet

Kresten Cæsar Torp Supplerende materiale til Biokemibogen liv, funktion, molekyle

Indholdsfortegnelse. Side 1 af 12

Geneious en manual til elevbrug

Danmarks Tekniske Universitet

Sundheds CVU Nordjylland INTERN PRØVE ANATOMI, FYSIOLOGI OG BIOKEMI S06V D. 15. JUNI 2006 KL

27611 Eksamen Sommer 2008

Velkommen Immunologisk Bioinformatik

Danmarks Tekniske Universitet. Løsningsforslag til Øvelse i Immonologisk Bioinformatik

Databasesøgning med BLAST

Klip-og-kopier DNA: reparér mutationer med 'genom-redigering' DNA, RNA og protein

Biokemi Udforsk livets kerne med en uddannelse i biokemi på Københavns Universitet

Proteiner. Proteiner er molekyler der er opbygget af "aminosyrer",nogle er sammensat af få aminosyrer medens andre er opbygget af mange tusinde

Indholdsfortegnelse. Side 1 af 10

INFOMØDE NY SEMESTERORDNING AARHUS UNIVERSITET

Immunologisk Bioinformatik

Indholdsfortegnelse. Side 1 af 19

Biologiske signaler i graviditeten - Genetisk information

Protein databases Rasmus Wernersson. (Slides af Henrik Nielsen & Morten Nielsen).

MiSeq i den daglige rutine. MRSA og VRE Isolater.

Epigenetik Arv er andet end gener

Sundheds CVU Aalborg INTERN PRØVE ANATOMI OG FYSIOLOGI HOLD S05S D. 9. JANUAR 2006 KL

Udvikling indenfor nano teknnologi. Ejner Bech Jensen Vice President Molekylær Bioteknologi Novozymes R&D

Hvorfor er genfinding et vanskeligt problem?

Genomics og big data sikrer ny indsigt i sygdom og nye muligheder for sundhedsvæsenet

KUNSTIG INTELLIGENS KOMMUNAL GAME CHANGER ELLER BARE BUZZ?

Anvendt BioKemi: Blod som et kemisk system, Struktur af blod

Undervisningsbeskrivelse

Struktur og funktion af gener

Machine Learning til forudsigelser af central KPI

Kompetenceudvikling af bioanalytikere

Velkommen. Test dit eget DNA med PCR. Undervisningsdag på DTU Systembiologi. Undervisere:

Biologi opgave Opsamling: Cellebiologi (Bioanalytiker modul3)

Danmarks Tekniske Universitet

Efterbehandling til Enzymer - Klip dit tis i stykker CIRKUS NATURLIGVIS

Kvarter -> Semester -E2017

Kædesøgning via citationer (Cited Reference Search) Web of Science er et citationsindex, som gør artiklernes referencelister er søgbare.

Web of Science Vejledning

Design og implementation af klynge-løsning til biologisk forskning

Notat. Testrapport - metode. Deep learning algoritme i billeddannende måleudstyr til måle- og klassificeringsanvendelser

Fysikken bag hverdagens materialer.

Immunologisk bioinformatik

Datalogistudiet. Rolf Fagerberg. Institut for Matematik og Datalogi Syddansk Universitet. Studiestart, 1. september 2014

Åbent Hus Kandidat Tilvalg/ Sidefag

Indholdsfortegnelse. Side 1 af 9

3y Bioteknologi A. Lærere TK og JM. Eksamensspørgsmål uden bilag

C.V. for PER NIELSEN

Computer Vision: Fysisk rehabilitering i eget hjem

Transkript:

Bioinformatik Open Source Software i biologiens tjeneste Kenneth Geisshirt kneth@silex.dk Silex Science ApS Bioinformatik p.1/19

Om Silex Science ApS Grundlagt maj 2002 Ejeren er Cortex Holding Fokusområderne hos Silex Science ApS er: High Performance Computing Open Source-baseret videnskabeligt og teknisk programmel Molekylær visualisering og modellering Bioinformatik Bioinformatik p.2/19

Molekylær biologi Molekylær biologien undersøger levende væsener på det molekylære plan. En del af molekylær biologiens data er sekvenser. En sekvens er en streng over et endeligt alfabet Bioinformatik p.3/19

DNA DNA er arvemassen - de sekvenser som bærer informationen om et levende væsen Alfabetet A, C, G, T. består af fire bogstaver (baser): DNA er dobbelt-strenget A T og G C sidder overfor hinanden Informationen grupperes i gener Menneskets genom består af basepar! Bioinformatik p.4/19

Proteiner Proteiner er kroppens arbejdsheste. Gener (DNA) oversættes til proteiner Alfabetet består af de 20 aminosyrer Proteiner kan modificeres efter oversættelse Sekundær struktur er en sekvens over alfabetet H, E, C 3-dimensional struktur giver funktionen Bioinformatik p.5/19

Proteiner Hormoner er små proteiner (peptider) Enzymer katalyserer biokemiske reaktioner Membranproteiner kan transportere molekyler over cellemembranen Transport af kemiske forbindelser, f.eks. hæmoglobins transport af oxygen Bioinformatik p.6/19

Offentlige databaser Op gennem 1990 erne blev forskellige organismers arvemasse kortlagt. GenBank indeholder alle DNA-sekvenser (100 GB) SwissProt har proteinsekvenser samt annoteringer om funktion PDB er til 3d-struktur af proteiner Alle har adgang til disse databaser. Bioinformatik p.7/19

Bioinformatik Bioinformatik er anvendelsen af informationsteknologi til håndteringen af biologiske data. Det er en tværfaglig disciplin: Molekylær biologi og biokemi Datalogi Statistik Kemi og fysik Bioinformatik p.8/19

Bioinformatik i praksis En typisk bioinformatik-gruppe i industrien: Computerne kører UNIX (og ofte Linux) Programmeringssproget er Perl Medlemmerne har en ph.d.-grad i biokemi eller molekylær biologi Stor åbenhed omkring teknologi Bioinformatik p.9/19

NCBI Toolkit CoreLib er et generisk bibliotek i ISO C AsnLib til håndtering af Abstract Syntax Notation 1 (ASN.1) Vibrant bruges til grafisk brugergrænseflader SEQ* indeholder funktioner til håndtering af sekvenser Licens: public domain Bioinformatik p.10/19

BLAST Basic Local Alignment Search Tool Søgning af sekvenser Alignment Bygger på NCBI Toolkit A T - C - T G A T - T G C A T - A - Licens: public domain Bioinformatik p.11/19

Predator Forudsigelse af sekundær struktur Skrevet i ISO C Benytter neurale netværk Nøjagtigheden er ca. 68 % Licens: kræver at en bestemt artikel citeres. Bioinformatik p.12/19

output layer Bioinformatik p.13/19 Neurale netværk hidden layer input layer

EMBOSS European Molecular Biology Open Software Suite Et bibliotek skrevet i ISO C (til UNIX) En række (kommando-linje) programmer (100+) Undersøtter Uniform Sequence Addresses Licens: GNU LGPL (bibliotek) og GNU GPL (programmer) Bioinformatik p.14/19

EMBOSS - eksempler Rotte-gener: seqret genbank::nc1102.seq:org:rattus genbank::rats.seq Gram-positive cocci surface proteins anchoring hexapeptide: preg ncbi::swissprot lp.tg[stgavde] -outfile swissprot.preg Statistik: pepstats ncbi::swissprot -outfile swissprot.stat Bioinformatik p.15/19

BioPerl BioPerl er et større bibliotek i Perl: Håndtering af sekvenser (læse, skrive, intern repræsentation) Kald af eksterne programmer (BLAST, Hmmer, etc,) Håndtering af alignment formater Licens: Artistic Bioinformatik p.16/19

BioPerl - eksempel use Bio::Seq; use Bio::SeqIO; $seq = Bio::Seq->new(-id => "myseq", -seq => "CGCCGAAGAAGCATCGTTAAAGTCTCTCTTCACCCTGCC -type => Dna ); $seqout = Bio::SeqIO->new( -format => fasta, -fh => \*STDOUT); $trans = $seq->translate(); # make a translation $seqout->write_seq($trans); Bioinformatik p.17/19

Litteratur Developing Bioinformatics Computer Skills. C. Gibas & P. Jambeck. O Reilly & Associates, 2001. Introduction to Computational Biology. M.S. Watermann. Chapman & Hall/CRC, 1995. Bioinformatics: The Machine Learning Approach. P. Baldi & S. Brunak. MIT Press, 2001. Computational Molecular Biology - An Algorithmic Approach. P.A. Pevzner. MIT Press, 2000. Bioinformatik p.18/19

Hjemmesider Det humane genom-projekt: http://www.jgi.doe.gov/programs/hgp.htm National Center for Biotechnology Information: http://www.ncbi.nih.gov Open Source Bioinformatics: http://bioinformatics.org How Perl Saved the Human Genome Project af L. Stein: http://bioperl.org/getstarted/tpj ls bio.html Bioinformatik p.19/19