Wykłady
- Wykład 1 – Wprowadzenie do analizy i eksploracji danych
- Wykład 2 – Zbiory danych, próby i statystyki
- Wykład 3 – Testy statystyczne i CTG
- Wykład 4 – Korelacja, regresja liniowa i tabele krzyżowe
- Wykład 5 – Analiza tabel krzyżowych
- Wykład 6 – Selekcja zmiennych w modelu
- Wykład 7 – Walidacja krzyżowa
- Wykład 8A – Błąd, wariancja i obciążenie modelu
- Wykład 8B – Klasyfikacja
- Wykład 9 – Metody klasyfikacji: naiwny Bayes i drzewa decyzyjne
- Wykład 10 – Metody bazujące na drzewach decyzyjnych: reguły decyzyjne i lasy losowe
- Wykład 11 – Metody bazujące na odległości
- Wykład 12 – Wybrane metody klasteryzacji
- Wykład 13 – Reguły asocjacyjne- analiza koszykowa
- Wykład 14 – Metoda algebraiczna – PCA
- Przykładowe zadanie na kolokwium końcowe
- Przykładowe sprawozdanie
Projekt
- KNIME kurs e-learningowy „Introductory Course to Data Science”
- Projekt jest 2-3 osobowy i polega na wyborze jednej z trzech grup metod: regresja, klasyfikacja lub klasteryzacja/grupowanie.
- przykładowe zbiory danych: iris (opis, klasyfikacja lub klasteryzacja), mtcars (opis, regresja), imports-85 (opis, regresja, klasyfikacja lub klasteryzacja), dressify (opis, klasyfikacja lub klasteryzacja), mushrooms (opis, klasyfikacja), adult (opis, klasyfikacja lub klasteryzacja)
- nowe zbiory danych z wizualizacją poprawnego przypisania do klas – łatwiejsze dla zadania klasteryzacji/grupowania
- przykładowy projekt regresja
- przykładowy projekt klasyfikacja
- przykładowy projekt klasteryzacja/grupowanie
- Projekt tutorial regresja
- Projekt rekomendacja sukienek, zbiór danych (klasyfikacja)
- projekty zip należy wypakować do katalogu knime-workspace, np. C:\Users\Robert\knime-workspace
- Każdy z projektów powinien wykorzystywać co najmniej 3 różne metody z danej grupy i 3 różne zbiory danych. Przykładowa strona ze zbiorami danych: UCI Machine Learning Repository
- Projekt ma się składać z porównania co najmniej trzech algorytmów na co najmniej trzech różnych zbiorach danych (co najmniej 9 wyników).
- Do każdego projektu należy sporządzić krótki raport (2-4 strony wraz z obrazkami, wykresami, tabelami) zawierający: jakie algorytmy/moduły zostały wykorzystane w projekcie, opis zbiorów danych, wyniki badań (porównanie dla różnych zestawów parametrów algorytmów i zbiorów danych) oraz z jakich źródeł się skorzystało.
- Projekt zalecam zrobić w KNIME Analytics Platform, chociaż można w innym narzędziu. Przykłady są w książce Guide to Intelligent Data Analysis dostępnej przez SPRINGER link na terenie UKSW. Wersja knime_3.5.0.win32.win32.x86_64.zip
Uniwersytet Kardynała Stefana Wyszyńskiego nie ponosi
odpowiedzialności za treść zamieszczonych tu materiałów. Treści i
opinie zawarte na tych podstronach są prywatnym zdaniem ich autorów i
nie stanowią oficjalnego stanowiska Uniwersytetu Kardynała Stefana
Wyszyńskiego.
Copyright © 2024 UKSW Wszelkie prawa zastrzeżone
Informacja o cookies