Course Outline

Εισαγωγή

  • Επισκόπηση του Spark και του Hadoop χαρακτηριστικών και αρχιτεκτονικής
  • Κατανόηση μεγάλων δεδομένων
  • Python βασικές αρχές προγραμματισμού

Ξεκινώντας

  • Ρύθμιση Python, Spark και Hadoop
  • Κατανόηση των δομών δεδομένων στο Python
  • Κατανόηση PySpark API
  • Κατανόηση HDFS και MapReduce

Ενσωμάτωση του Spark και του Hadoop με το Python

  • Εφαρμογή Spark RDD στο Python
  • Επεξεργασία δεδομένων χρησιμοποιώντας το MapReduce
  • Δημιουργία κατανεμημένων συνόλων δεδομένων σε HDFS

Machine Learning με το Spark MLlib

Επεξεργασία Big Data με Spark Streaming

Εργασία με Συστήματα Recommender

Δουλεύοντας με τους Kafka, Sqoop, Kafka και Flume

Apache Mahout με Spark και Hadoop

Αντιμετώπιση προβλημάτων

Περίληψη και Επόμενα Βήματα

Requirements

  • Εμπειρία με το Spark και το Hadoop
  • Python εμπειρία προγραμματισμού

Ακροατήριο

  • Επιστήμονες δεδομένων
  • προγραμματιστές
 21 Hours

Number of participants


Price per participant

Testimonials (3)

Upcoming Courses

Related Categories