Termin: 20.01.2015
Zadanie polega na analizie danych z eksperymentów ChIP-seq pewnej modyfikacji histonów oraz pewnego białka u muszki owocowej Drosophila melanogaster, w kontekście różnicowej eksprecji genów w różnych tkankach.
Pod adresem znajdują się dane do analizy:
- plik z adnotacją genomu dme3:
dm3_genes.gtf
Genom w odpowiedniej wersji (dm3) znajduje się tu. - kontrola dla eksperymentów ChIP-seq (plik
input.txt.gz
) - wyniki różnicowej analizy ekspresji genów w tkankach Elav i Repo wykonanej przy użyciu programu DEseq (plik
DEseq.txt
) - dla każdej osoby zapisanej na przedmiot indywidualny folder (oznaczony numerem indeksu) zawierający: wyniki eksperymentu ChIP-seq dla pewnej modyfikacji histonów (plik
A.txt.gz
), oraz dla pewnego innego białka (plikB.txt.gz
). Obie próbki dotyczą tej samej tkanki.
Uwaga: jeśli czyjegoś numeru indeksu brak, lub ma problem z danymi (plik jest uszkodzony itp.) lub ma pytania dotyczące treści, prosimy zgłaszać je możliwie szybko na adres:
j.herman-izycka@mimuw.edu.pl
Pytania:
0. Wykonaj preprocessing danych z sekwencjonowania (analiza jakości, filtrowanie, mapowanie)
1. Zbadaj czy modyfikacja histonów A i białko B mają preferencje co do miejsca występowania w regionach genów (np. na 5′ lub 3′ końcu genów)?
2. Czy w obszarach genowych występowanie białka B i modyfikacji A są skorelowane?
3. Czy geny, na których znajduje się białko B wykazują różnicową ekspresję między tkankami Elav i Repo?
Jako rozwiązanie należy wysłać raport pod adres bartek@mimuw.edu.pl
, a następnie omówić go osobiście. Raport powinien zawierać odpowiedzi na pytania wraz z uzasadnieniem, krótki opis wykonanych kroków (użyte programy, istotne parametry, metody, podsumowanie wyników). Można, a nawet należy zamieścić wykresy.
Jeśli ktoś ma duży problem ze zmapowaniem swoich danych (ponieważ są bardzo złej jakości – na całej długości średnio < 20, i przez to się słabo mapują), to można wziąć inny zbiór danych (z czyjegoś folderu), ale trzeba opisać to w raporcie.