Slajdy są tutaj
Popatrzmy na zbiory danych:
- Dzielnice Denver (zmienne to : populacja (X1), % zmiany populacji (X2), % dzieci <18 w populacji (X3), % korzystających z darmowych obiadów (X4), zmiana dochodów (X5), wskaźnik przestępczości (/1000 mieszkańców)(X6), zmiana wsk. przestępczości (X7)). Dane pochodzą z Piton foundation
- Samochody (dane pochodzą z Kelly Blue Book)
Zadanie 1. Wczytaj te dane do R’a przy pomocy funkcji read.csv. Zwróć uwagę na inne prametry np (sep=”t”)
Zadanie 2. Wyrysuj zależności parami przy pomocy funkcji plot()
Zadanie 3. Znajdź dobry model liniowy opisujący wsp. przestępczośći (X6) i zmiane przestepczości (X7)
Zadanie 4. Znajdz model liniowy opisujący dobrze cenę samochodu
Zadanie 5. Które zmienne mają największy wplyw na zmienne objasniane
Zadanie 6. Jak zachowuja sie reszty w wyznaczonych modelach liniowych
Zadanie 7. Sprobuj zainstalowac pakiet glmnet i znalezc oszczedne modele opisujace zmiennosc przestepczosci w dzielnicach