Dziś będziemy przyglądać się metodom redukcji wymiaru.
Dla przykładu weźmy zbiór danych o ekspresji genów u Drożdży.
Zawiera on dane z pomiaru poziomu mRNA w populacji komórek drożdży pod wpływem różnego rodzaju stresu.
0. Wczytaj dane do macierzy w R
1. Dokonaj analizy PCA funkcjami princomp i svd (obserwacje=geny, warunki=zmienne). Zanalizuj ważność składowych i wyrysuj kilka pierwszych na wykresach 2-wymiarowych.
2. przekształć dane do macierzy odległości (dist()) i zastosuj skalowanie wielowymiarowe do 2-wymiarów (cmdscale()). Wybierz jakąś inną metrykę w funkcji dist i porównaj wyniki. Przyjrzyj się też funkcji isoMDS z pakietu MASS, która dotyczy przypadku macierzy odległości nie spełniających nierówności trójkąta.
3. Zastosuj grupowanie metodą k-means, aby uzyskać kilka (3-4) grupy genów zbliżonych do siebie profliem ekspresji..Użyj pakietu ggplot2 (f. qplot()) do narysowania wykresu 2D i pokoloruj punkty wg. przynależności do grup z k-means.