Dziś będziemy mówić o drzewach decyzyjnych.
Interesuje nas metoda zachłąnnej konstrukcji drzew decyzyjnych względem optymalizacji “Gini impurity” (tj. w metodzie CART) lub zawartości informacyjnej, tj. w metodach ID3 i C4.5.
Będziemy używać pakietów rpart i C50, które implementuje metody inspirowane odpowiednio metodami CART i C45.
0. Zainstaluj pakiety rpart i C50. wczytaj pakiet MASS.
1. Zastosuj oba pakiety do klasyfikacji obserwacji ze zbioru iris w pakiecie MASS, porównaj uzyskane drzewa.
2. Zastosuj oba pakiety do klasyfikacji obserwacji ze zbioru car.test.frame. porównaj uzyskane drzewa.
3. Zainstaluj pakiet mboost i zastosuj drzewa decyzyjne także do danych ze zbioru bodyfat (data(“bodyfat”, package = “mboost”))