Schulungsübersicht

Einführung in Google Colab und Apache Spark

  • Überblick über Google Colab
  • Einführung in Apache Spark
  • Einrichten von Spark in Google Colab

Datenverarbeitung mit Apache Spark

  • Arbeiten mit RDDs und DataFrames
  • Laden und Verarbeiten großer Datensätze
  • Verwendung von Spark SQL zur Abfrage strukturierter Daten

Fortgeschrittene Analytik mit Spark

  • Maschinelles Lernen mit Spark MLlib
  • Durchführen von Datenanalysen in Echtzeit
  • Verteiltes Rechnen mit Spark

Visualisierung und Collaboration in Google Colab

  • Integration von Colab mit gängigen Visualisierungsbibliotheken
  • Kollaborative Arbeitsabläufe mit Colab-Notebooks
  • Gemeinsame Nutzung und Export von Ergebnissen

Optimieren von Big Data Arbeitsabläufen

  • Abstimmung von Spark auf Leistung
  • Optimierung von Speicher und Speichernutzung
  • Skalieren von Workflows für große Datensätze

Big Data in der Cloud

  • Integration von Google Colab mit Cloud-basierten Tools
  • Verwendung von Cloud-Speicher für große Daten
  • Arbeiten mit Spark in verteilten Cloud-Umgebungen

Fallstudien und Best Practices

  • Überblick über reale Big-Data-Anwendungen
  • Fallstudien mit Apache Spark und Colab
  • Bewährte Praktiken für Big-Data-Analysen

Zusammenfassung und nächste Schritte

Voraussetzungen

  • Grundlegende Kenntnisse der Konzepte der Datenwissenschaft
  • Vertrautheit mit Apache Spark
  • Python Programmierkenntnissen

Zielgruppe

  • Datenwissenschaftler
  • Dateningenieure
  • Forscher, die mit Big Data arbeiten
 14 Stunden

Teilnehmerzahl


Price per participant (excl. VAT)

Erfahrungsberichte (5)

Kommende Kurse

Verwandte Kategorien