Dane (sparowane odczyty z genomu ludzkiego) są dostępne tu. Dobrze byłoby zacząć od QC, żeby zobaczyć z czym mamy do czynienia. Potem mapujemy wg. standardowych parametrów do genomu ludzkiego (hg19). Warto porównać to co wyjdzie nam przy pomocy programu bowtie (z opcją -2) i to co wychodzi przy pomocy programu BWA (zmapowane odczyty w pliku sam)
Będziemy robić zadania z tutorialu, który jest tutaj
Interesuje nas sekcja 3, czyli o znajdowaniu snipow przy pomocy mpileup z samtools i bcftools.
Poza tym chcemy nauczyć się korzystać z pakietu GATK do lokalnego re-alignmentu (sekcja 4) i snp-callingu (sekcja 5)
A także do porównywania znalezionych snpów do dbSNP (sekcja 7) przy użyciu podanego pliku vcf.
Porównaj warianty znalezione przy pomocy mappera BWA z tymi, które otrzymujemy przy pomocy bowtie. pliki VCF znajdziesz tu