Dziś rozmawiamy o prostych metodach kostrukcji drzew na podstawie macierzy odległości. Slajdy na dzis wyk4
Na laboratorium będziemy konstruować drzewa w praktyce.
Warto zapoznać się z dokumentacją modułu Bio.Phylo w tutorialu jak i na stronie wiki.
1. Na początek ustalmy dwie listy sekwencji. Rozważmy sekwencje paralogiczne histonów z drożdży z poprzednich zajęć oraz ortologi ludzkiej hydroksylazy fenyloalaniny Human_PAH_orthologues.fa. Dla histonów musimy je najpierw przetłumaczyć na białka (s.translate()), a dla drugiego zbioru mamy już sekwencje aminokwasowe.
2. Wylicz macierze odległości dla tych grup sekwencji przy pomocy klasy Bio.Phylo.TreeConstruction.DistanceCalculator (dla macierzy BLOSUM62, osobno dla histonów, i osobno dla genów PAH – to zajmie chwilę). Można użyć plików Human_PAH_orthologues i Human_PAH_paralogues oraz Human_H2BFS_paralogues i duży plik Human_PAH_orthologues-91.
3. Stwórz drzewa filogenetyczne na podstawie macierzy przy pomocy klasy Bio.Phylo.TreeConstruction.DistanceTreeConstructor zarówno metodą UPGMA – hierarchiczną jak i nj (neighbor joining)
4. Wyświetl uzyskane drzewa przy pomocy metody draw_ascii() i draw()
5. Zapisz uzyskane drzewa do formatów newick i phyloxml. obejrzyj wyniki.