Introduktion til de praktiske øvelser Vi vil i dag fokusere på tre forskellige online software til SNP analyser snptree NDtree CSIphylogony
Introduktion til SNP analyser http://cge.cbs.dtu.dk/services/all.php
snptree DRAG n Drop (eller brug Browse) til at uploade filer eller vælg din egen reference (index case? draft genome)!! Vælg en reference (samme bakterielle species) Vælg data format (her: Assembled genomes) Vælg minimal distance der skal være imellem SNPs.
Prune? Hvad er SNPs og hvad bruger vi dem til? Hvad er forudsætningen for at vi kan bruge dem?
Lidt om...filnavne. Kirsten Siggaard Kirsten_Siggaard Ingen MELLEMRUM (eller sære tegn!) i filnavne!!!
snptree Vælg minimal distance der skal være imellem SNPs. Submit..og vent eller start et nyt job..
Vælg alt CTRL + A teksten i vinduet og kopier CTRL + C Åben herefter MS Excel og sæt teksten ind CTRL + V
Vælg alt CTRL + A teksten i vinduet og kopier CTRL + C Åben herefter TreeViewer og sæt teksten ind CTRL + V http://cge.cbs.dtu.dk/services/treeviewer-1.0/treeviewer.php
http://cge.cbs.dtu.dk/services/treeviewer-1.0/treeviewer.php
http://cge.cbs.dtu.dk/services/treeviewer-1.0/treeviewer.php Copy/Paste tekst fra NEWICK filen her! Tryk på Adjust Tree og herefter Load Newick, for at implementere ændringer. Vil I prøve anden Træ-viewer, så kan man hente FigTree her: http://tree.bio.ed.ac.uk/software/figtree/
Extracting archives: 7-ZIP: http://7-zip.org/ WinRar: http://www.rarlab.com/download.htm
Bemærk:.vcf filer i Windows er kontakt-filer til Outlook!! For at åbne en bioinformatisk.vcf fil* skal man højre-klikke på filen og vælge Åben med og vælge Notesblok som standardprogram til denne filtype! * En bioinformatisk.vcf fil indeholder information om alle SNPs i forhold til referencen for hver af de sekvenser, man har uploadet.
Vælg alt CTRL + A teksten i vinduet
Vælg alt CTRL + A teksten i vinduet og kopier CTRL + C Åben herefter MS Excel og sæt teksten ind CTRL + V
NDtree DRAG n Drop (eller brug Browse) til at uploade filer Vælg Fast mode i dag Vælg din egen foretrukne reference eller lad serveren identificere det bedste match fra en meget lang liste af fuldt sekventerede genomer fra NCBI...
Find filen i Download eller Overførsler mappen i Windows stifinder Bemærk:.mat filer i Windows er MS Access filer!! For at åbne en bioinformatisk.mat distancefil skal man højreklikke på filen og vælge Åben med og vælge Notesblok som standardprogram til denne filtype! Herefter kopieres indholdet CTRL + A, CTRL + C og sættes ind i Excel CTRL + V P.S. Output kan være ret svært at læse (det arbejdes der på)
Vælg alt med CTRL + A og kopier CTRL + C Åben herefter ThreeViewer og sæt teksten ind CTRL + V http://cge.cbs.dtu.dk/services/treeviewer-1.0/treeviewer.php
CSI Phylogeny
Vælg din egen reference (index case/typestamme?)!! DRAG n Drop (eller brug Browse) til at uploade filer
Vælg minimal distance der skal være imellem SNPs. Submit dit job
Vælg alt med CTRL + A og kopier CTRL + C Åben herefter TreeViewer og sæt teksten ind CTRL + V http://cge.cbs.dtu.dk/services/treeviewer-1.0/treeviewer.php Herefter kopieres indholdet i Notepad med CTRL + A, CTRL + C og sættes ind i Excel CTRL + V
Herefter kopieres indholdet i Notepad med CTRL + A, CTRL + C og sættes ind i Excel CTRL + V
SNP øvelsen Øvelsessættet består af 7 Klebsiella pneumoniae stammer relateret til et udbrud af CTX-M-15/SHV-28 producerende K. pneumoniae med udgangspunkt i Hospitalet i Hillerød. Herudover vil I få udleveret den nærmest beslægtede (fuldt sekventerede) NCBI reference stammer. Og et ESBL producerende E. coli stamme til at teste med.
Test data Navn År Dato Sted Patient Species Kpn_1 2006 04.01 A 1 K. pneumoniae Kpn_2 2008 22.01 B 2 K. pneumoniae Kpn_3 2008 14.07 B 3 K. pneumoniae Kpn_4 2008 02.12 A 4 K. pneumoniae Kpn_5 2008 14.03 C 5 K. pneumoniae Kpn_6 2009 03.04 C 4 K. pneumoniae Kpn_7 2009 06.08 C 6 K. pneumoniae Ref_1084?? NCBI Reference K. pneumoniae Ec 2008 E. coli
Leg og lær. Tanken er, at I kan prøve én eller flere af de forskellige SNP webservere af med dette testsæt. Det er muligt at sætte mere end ét job over ad gangen...men husk på, at vi er 25, der gør det samtidig, hvilket godt kan have en effekt på hastigheden af serveren. Skulle det gå helt galt, kan vi blive nødt til at genstarte serveren!!
I kan få tilsendt en e-mail med resultatet Resultatet vil kun være tilgængeligt i 48 timer på serveren.herefter slettes linket. Så vil I gerne gemme resultaterne af jeres fremtidige søgninger, er I nødt til at gemme filerne! Kører I flere jobs, så anbefales det varmt, at I skriver en lille note ned angående jobbet (Hvilken reference, hvilken prune, hvilke stammer osv.)
Kom godt i gang..uden at lægge serveren ned.. Jeg har allerede lavet tre jobs, som I kan prøve at kigge resultaterne for. De tre jobs er: 1. snptree (prune=10 bp) lavet med de 7 kpn teststammer og med Kp MGH_78578 som reference. http://cge.cbs.dtu.dk//cgi-bin/webface.fcgi?jobid=538b6b9a00006bf4c1a31f46 2. NDtree på de 7 kpn teststammer og uden valgt referencestamme. http://cge.cbs.dtu.dk//cgibin/webface.fcgi?email=hhas%40food.dtu.dk&jobid=538b6edd000076ed99d9def6&change=change 3. CSI Phylogeny (prune=10 bp) med de 7 kpn teststammer og Kpn 1084 som reference. http://cge.cbs.dtu.dk//cgi-bin/webface.fcgi?jobid=538b6f5b00007800b5234453 Kan I identificere udbrudsstammerne imellem de 7 isolater.
Prøv jer frem. I kan prøve at tjekke nogle af outputfilerne ud. Kan I finde, hvor mange SNPs der er til forskel imellem de forskellige udbrudsstammer? Synes I, at det er få eller mange SNPs? Stemmer resultatet overens med epidemiologien? Kan I få hentet NEWICK filen og få den over i TreeViewer? Prøv at ændre på træet i ThreeViewer.
Prøv jer frem. Prøv at gentage jobbet med ændrede parametre: højere prune ændre reference til index case (kpn_1) samme sæt data med en af de to andre web-servere. Prøv at analysere på de nærtbeslægtede stammer alene. Inkludér E. coli stammen. Får I samme resultater med de ændrede parametre? Hvordan reagerer de forskellige SNP-servere på at der kommer en forkert species (her E. coli) med i analysen? Er det mest sandsynligt, at patient 4 er konstant bærer eller er det mest sandsynligt, at han er blevet smittet af patient 5 ud fra dendrogrammerne?
Resultater.. 1. snptree, alle 7 stammer, reference (MGH.), 10 prune 2. snptree, alle 7 stammer, reference (kpn_7), 10 prune 3. NDtree, alle 7 stammer, ingen valgt reference 4. CSI Phylogeny, alle 7 stammer, Ref (1084), 10 prune 5. snptree, 6 sidste stammer, Ref (kpn_1), 10 prune 6. NDtree, 6 sidste stammer, Ref (kpn_1) 7. CSI Phylogeny, 6 sidste stammer, Ref (kpn_1), 10 prune 8. CSI Phylogeny, 7 + EC, Ref (1084), 10 prune 9. snptree, 7 + EC, Ref (1084), 10 prune 10. NDtree, 7 + EC, Ref (1084) 11. snptree, 6 udbrudsstammer, Ref (kpn_1), prune 10 12. NDtree, 6 udbrudsstammer, Ref (kpn_1) 13. CSI Phylogeny, 6 udbrudsstammer, Ref (kpn_1), prune 10
1. snptree, alle 7 stammer, reference (MGH.), 10 prune
2. snptree, alle 7 stammer, reference (kpn_7), 10 prune
3. NDtree, alle 7 stammer, ingen valgt reference
4. CSI Phylogeny, alle 7 stammer, Ref (1084), 10 prune
5. snptree, 6 sidste stammer, Ref (kpn_1), 10 prune
6. NDtree, 6 sidste stammer, Ref (kpn_1)
7. CSI Phylogeny, 6 sidste stammer, Ref (kpn_1), 10 prune
8. CSI Phylogeny, 7 + EC, Ref (1084), 10 prune
9. snptree, 7 + EC, Ref (1084), 10 prune
10. NDtree, 7 + EC, Ref (1084)
11. snptree, 6 udbrudsstammer, Ref (kpn_1), prune 10
12. NDTree, 6 udbrudsstammer, Ref (kpn_1),
13. CSI Phylogeny, 6 udbrudsstammer, Ref (kpn_1), prune 10