Der Kurs konzentriert sich auf die Komponenten der Datenerfassung, -aufnahme, -katalogisierung, -speicherung und -verarbeitung der Analysepipeline. Du lernst, Amazon Redshift in einen Data Lake zu integrieren, um sowohl Analyse- als auch maschinelle Lernarbeitslasten zu unterstützen. Du wirst auch lernen, die besten Praktiken für Sicherheit, Leistung und Kostenmanagement auf den Betrieb von Amazon Redshift anzuwenden.
Modul A: Überblick über Datenanalyse und die Datenpipeline
- Anwendungsfälle der Datenanalyse
- Verwendung der Datenpipeline für die Datenanalyse
Modul 1: Verwendung von Amazon Redshift in der Datenanalyse-Pipeline
- Warum Amazon Redshift für Data Warehousing?
- Überblick über Amazon Redshift
Modul 2: Einführung in Amazon Redshift
- Architektur von Amazon Redshift
- Interaktive Demo 1: Rundgang durch die Amazon Redshift-Konsole
- Amazon Redshift-Funktionen
- Übung 1: Laden und Abfragen von Daten in einem Amazon Redshift-Cluster
Modul 3: Ingestion und Speicherung
- Datenübernahme
- Interaktive Demo 2: Verbinden deines Amazon Redshift-Clusters mit einem Jupyter-Notebook mit Daten-API
- Datenverteilung und -speicherung
- Interaktive Demo 3: Analysieren semi-strukturierter Daten mit dem Datentyp SUPER
- Abfrage von Daten in Amazon Redshift
- Übung 2: Datenanalyse mit Amazon Redshift Spectrum
Modul 4: Verarbeiten und Optimieren von Daten
- Datentransformation
- Erweiterte Abfragen
- Praxisübung 3: Datentransformation und -abfrage in Amazon Redshift
- Verwaltung von Ressourcen
- Interaktive Demo 4: Anwendung von gemischtem Workload-Management auf Amazon Redshift
- Automatisierung und Optimierung
- Interaktive Demo 5: Größenänderung des Amazon Redshift-Clusters vom dc2.large zum ra3.xlplus-Cluster
Modul 5: Sicherheit und Überwachung von Amazon Redshift-Clustern
- Absicherung des Amazon Redshift-Clusters
- Überwachung und Fehlersuche bei Amazon Redshift-Clustern
Modul 6: Entwerfen von Data Warehouse-Analytiklösungen
- Überprüfung von Data-Warehouse-Anwendungsfällen
- Aktivität: Entwerfen eines Data-Warehouse-Analyse-Workflows
Modul B: Entwickeln moderner Datenarchitekturen auf AWS
- Moderne Datenarchitekturen