Klastrowanie

Dziś zajmiemy się klastrowaniem. Mamy do dyspozycji dwa rodzaje metod: hierarchiczne (hclust) i typu k-średnich (kmeans i pam z modułu cluster)

0. Przypomnijmy sobie zbiór danych iris z biblioteki class (z poprzednich zajęć)

1. Spróbuj użyć metody kmeans do poklastrowania zbioru obserwacji iris

2. przyjrzyj się metodzie dist i wyznacz kilka macierzy odleglosci dla obserwacji z iris

3. użyj tych macierzy do otrzymania klasteryzacji typu k-medoids(pam z library(clust))

4. Wyznacz różne klasteryzacje hierarchiczne metodą hclust. Wyświetl dendrogram  metodą plot(). Zidentyfikuj klastry metodą hclust.rect() lub identify().

 

Leave a Reply

Your email address will not be published. Required fields are marked *