Bieżący wykład: wyk8-wizualizacja
I zaległy wyk7-obliczenia
@ MIM UW
Dzisiejszym zadaniem jest napisanie pakietu testującego szybkość zaimplementowanych przez nas funkcji sortujących. Pakiet musi posiadać następujące funkcjonalności: Continue reading “WDI – zajęcia 8”
Dzisiaj będzie o modułach. Slajdy są tu: wyk7-moduly
Przyda się także przykładowy pakiet wdi: wdi.tar
EDIT: Jeszcze skrypty do dzisiejszego wykładu (przed użyciem trzeba zmienić rozszerzenie z .txt na .py) : simple i script_with_argparse
Z zeszłego tygodnia mamy jeszcze slajdy (b. krótkie) wyk6-zmienne i kod, na podstawie którego odbyła się reszta wykładu wyk6-code
v = 1 def foo(): v = 2 print v print v foo() print v
v = 1 def foo(): global v v = 2 print v print v foo() print v
Słowniki:
Rozgrzewka (najlepiej w ipythonie):
dzisiaj o słownikach w pythonie wyk5-slowniki
Sekwencjonowanie DNA w technologiach nowej generacji prowadzi do odczytania milionów krótkich sekwencji DNA zwanych odczytami. Często potrzeba odnaleźć pozycje takich odczytów w genomie, czyli zmapować je do genomu. Proces mapowania odczytów (sekwencji DNA) do genomu referencyjnego polega (w dużym uproszczeniu) na przypisaniu każdemu odczytowi współrzędnych genomowych n, m
wskazujących odpowiednio chromosom oraz numer pary zasad w sekwencji tego chromosomu z genomu referencyjnego. Te współrzędne oznaczają miejsce z którego dany odczyt najprawdopodobniej został wygenerowany (chromosom oraz początkową pozycję na tym chromosomie).
Continue reading “WDI – zadanie zaliczeniowe 1”
1. W pliku DNA.txt znajduje się fragment nici DNA człowieka. Znajdź liczbę wszystkich wystąpień sekwencji ACGT. Wypisz wszystkie pozycje, na których znajduje się ta sekwencja.
2. Napisz funkcję statystyki(nazwa_pliku)
, która dla danego pliku nazwa_pliku
stworzy plik statystyka_nazwa_pliku
, w którym zamieści linijkę z liczbą linii, liczbą słów, oraz informacją, którym znakiem w pliku jest znak ‘!’. Napisz funkcję sprawdz(nazwa_pliku)
, która sprawdzi, czy statystyka w pliku statystyka_nazwa_pliku jest aktualna.
3. (★) K-merami nazywamy sekwencje DNA (czyli sekwencje składające się z liter A,C,G,T) długości k. Dla pliku DNA.txt wypisz najczęściej występujący 4-mer.
Wskazówka:
4. W pliku HP1b.gff3 znajdują się dane o miejscach wiązania białka HP1b do nici DNA muszki owocowej. Znajdź średnią wartość sygnału dla chromosomu 2L na pozycjach zawartych między 1,000,000 a 5,000,000.