1. Business Understanding für die Datenanalyse
- Wissens-Check Data Science und Künstliche Intelligenz
- Die Fähigkeiten und Rolle des Data Scientisten
- Die Zusammensetzung von Daten-Teams
- Vertikale Anwendungsfelder in Unternehmen
- Horizontale Anwendungsfelder in Unternehmen
- Überwachtes Lernen: Klassifikation, Regression, Zeitreihen
- Unüberwachtes Lernen: Segmente, Anomalien, Muster
- Verstärkendes Lernen (Reinforcement Learning)
- Daten erfassen und Relevanz beurteilen
- Big Data, Datentypen, Datenstrukturen
- Datenintegration, Datenquellen, Datenbanken
- Data Warehouse, virtuelle Datenbanken und Data Lake
2. Bedienung und erste Schritte in KNIME
- Installation und Workspace einrichten
- Das Konzept der Nodes und Workflows
- Die Benutzeroberfläche kennenlernen
- Excel Reader und Konfigurationsmenü
- Outputs und weitere Import-Nodes
- Dokumentation und Workflow-Organisation
3. Data Understanding und Data Preparation
- Datenvorbereitung: Probleme erkennen
- Strategien zur Problembehebung
- Harmonisierung von Zeitreihen
- Datenvisualisierung und Datenanalyse
- Tabellen, Diagramme, Parameter, Kovarianz
- Datenvisualisierung in KNIME
- Datenbereinigung in KNIME
- Datentransformation in KNIME
4. Data Modeling
- Eigenschaften für das Modeling
- Algorithmus und Methodik auswählen: Klassifizierung und KNN
- Ergebnis beurteilen: Klassifizierung und KNN
- Machine Learning in KNIME: Klassifikation
- Algorithmus und Methodik auswählen: Regression und Clustering
- Ergebnis beurteilen: Regression und Clustering
- Machine Learning in KNIME: Komplexe Klassifikation und Clustering
5. Deployment, Überwachung und Fehlersuche
- Implementierung des Modells
- Strukturiertes Testing des Modells
- Systematische Fehlersuche
- Überwachung und Überprüfung
- Wartung und Aktualisierung
- Export von Daten in Datenbanken
- Erstellen und Versenden von Reports
- Automatisierte Ausführung des KNIME-Workflows
6. Abschlussprojekt
Nach den Praxisaufgaben, mit denen verschiedene Szenarien und die einzelnen Stufen des CRIPS-DM-Prozesses eingeübt wurden, steht am Ende des Kurses ein Abschlussprojekt, in dem der ganze Datenanalyse-Prozess durchlaufen wird.