Slides for today’s lecture are here: WBO-10-gene-families
English version below
Zadania na dziś:
1. Zapoznaj się z testem Fishera (np w pakiecie scipy.stats.fisher_exact) i metodą GSEA zaimplementowaną w Istytucie Broad’a
2. Zapoznaj się z formatami plików OBO i GAF z projektu gene ontology: opis formatów, przykładowy plik GAF, przykładowy plik OBO
3. Napisz prosty program, który testuje testem Fishera, wraz z poprawką Bonferroniego wzbogacenie funkcji GO w zadanym zbiorze genów.
4. Przetestuj to na połączonym zbiorze histonów i homologów PAH
5 (*). Zaimplementuj uproszczoną (wyliczanie statystyki ES dla kolejnych fragmentów rankingu, wykreślanie krzywej wzbogacenia i istotności, bez poprawki FDR) metodę GSEA na podstawie opisu z suplementu do pracy o GSEA 06580SuppText
English version of today’s assignments:
1. Take a look at the Fisher’s exact test as implemented in the scipy.stats.fisher_exact and with the GSEA method implemented at the Broad Institute
2. Look at the ontology ( OBO ) i and gene annotation ( GAF) file formats from the gene ontology project: format description, sample GAF file, sample OBO file
3. Write a simple program that implements gene set enrichment testing on a given set of gene identifiers for a given set of annotations (assume a GAF file is given, and test all the annotated terms in this file against the given set of gene identifiers, score using FIsher’s exact test with bonferroni correction).
4. Test it on the joined set of PAH and histone genes
5 (*). Implement a simplified GSEA approach (computing the ES score and the enrichment curve for a single gene set and gene ranking, without the FDR)based on supplementary methods to the GSEA paper 06580SuppText