Course Outline
Εισαγωγή
- Επισκόπηση του Spark και του Hadoop χαρακτηριστικών και αρχιτεκτονικής
- Κατανόηση μεγάλων δεδομένων
- Python βασικές αρχές προγραμματισμού
Ξεκινώντας
- Ρύθμιση Python, Spark και Hadoop
- Κατανόηση των δομών δεδομένων στο Python
- Κατανόηση PySpark API
- Κατανόηση HDFS και MapReduce
Ενσωμάτωση του Spark και του Hadoop με το Python
- Εφαρμογή Spark RDD στο Python
- Επεξεργασία δεδομένων χρησιμοποιώντας το MapReduce
- Δημιουργία κατανεμημένων συνόλων δεδομένων σε HDFS
Machine Learning με το Spark MLlib
Επεξεργασία Big Data με Spark Streaming
Εργασία με Συστήματα Recommender
Δουλεύοντας με τους Kafka, Sqoop, Kafka και Flume
Apache Mahout με Spark και Hadoop
Αντιμετώπιση προβλημάτων
Περίληψη και Επόμενα Βήματα
Requirements
- Εμπειρία με το Spark και το Hadoop
- Python εμπειρία προγραμματισμού
Ακροατήριο
- Επιστήμονες δεδομένων
- προγραμματιστές
Testimonials (3)
The fact that we were able to take with us most of the information/course/presentation/exercises done, so that we can look over them and perhaps redo what we didint understand first time or improve what we already did.
Raul Mihail Rat - Accenture Industrial SS
Course - Python, Spark, and Hadoop for Big Data
I liked that it managed to lay the foundations of the topic and go to some quite advanced exercises. Also provided easy ways to write/test the code.
Ionut Goga - Accenture Industrial SS
Course - Python, Spark, and Hadoop for Big Data
The live examples