IT-Trainingshaus

Machine Learning und Data Mining mit R

Kurs-Nr. P31012

Dauer:3 Tage

Dieser Kurs ist eine Einführung in moderne Methoden des maschinellen Lernens mit R. Anhand von Praxisbeispielen werden Data Mining und maschinelles Lernen vorgestellt. Während das Data Mining vorrangig auf die Ableitung von Erkenntnissen aus vorhandenen Daten abzielt, geht es beim Maschinellen Lernen mehr um Vorhersagen, d. h. die Anwendung der zuvor trainierten Modelle auf neue Daten.

Schwerpunkte:

  • Supervised Learning / Überwachtes Lernen für Regressions- und Klassifikationsprobleme:
    - Lineare Regression mit kontinuierlichen und kategorialen Prädiktoren
    - algorithmen-basierte Modelloptimierung / automatisierte Auswahl von Prädiktoren (best subsets, forward, backward)
    - logistische Regression
    - Lasso und Ridge-Regression
    - Interaktionseffekte
    - GAM (generalized additive model)
    - KNN (k nearest neighbors)
    - Entscheidungsbäume (Decision trees)
    - SVM (Support Vector Machine)
    - Random Forest
    - GBM (Gradient Boosting Machine)
    - Arbeiten mit dem R-Paket caret: Schnittstelle zu vielen Algorithmen mit vereinheitlichter Syntax; Modell-Evaluation
      und Modellvergleiche mit modernen Resampling-Methoden (z. B. 5-fache Kreuzvalidierung mit 5 Wiederholungen)
    - Klassifikation: spezielle Methoden zum Umgang mit unbalancierten Klassen
  • Unsupervised Learning / Unüberwachtes Lernen
    - k-means
    - hierarchische Clusteranalysen
    - Dimensionsreduktion, PCA (Principal Components Analysis)
    - PCA als Vorstufe für Regressionsanalysen; PCR (Principal Components Regression) und PLS (Partial Least Squares)


Voraussetzungen:

Grundkenntnisse in R sind sinnvoll, um die Code-Beispiele nachzuvollziehen.

Preis:1.450,- € zzgl. MwSt.

Termine:

  • 23.05.2018 - 25.05.2018
  • 04.07.2018 - 06.07.2018
  • 19.09.2018 - 21.09.2018

Anmeldeformular (Online)

Anmeldeformular (PDF)