Plan du cours
Introduction
- Vue d'ensemble de Spark et Hadoop caractéristiques et architecture
- Comprendre le big data
- Python bases de la programmation
Pour commencer
- Configurer Python, Spark et Hadoop
- Comprendre les structures de données dans Python
- Comprendre l'API PySpark
- Comprendre HDFS et MapReduce
Intégrer Spark et Hadoop à Python
- Implémenter Spark RDD dans Python
- Traiter les données à l'aide de MapReduce
- Créer des ensembles de données distribués dans HDFS
Spark et Spark MLlib Machine Learning avec Spark MLlib
Traiter Big Data avec Spark Streaming
Travailler avec des systèmes de recommandation
Travailler avec Kafka, Sqoop, Kafka et Flume
Apache Mahout avec Spark et Hadoop
Résolution des problèmes
Résumé et prochaines étapes
Pré requis
- Expérience avec Spark et Hadoop
- Python expérience en programmation
Audience
- Scientifiques des données
- Développeurs
Nos clients témoignent (3)
The fact that we were able to take with us most of the information/course/presentation/exercises done, so that we can look over them and perhaps redo what we didint understand first time or improve what we already did.
Raul Mihail Rat - Accenture Industrial SS
Formation - Python, Spark, and Hadoop for Big Data
I liked that it managed to lay the foundations of the topic and go to some quite advanced exercises. Also provided easy ways to write/test the code.
Ionut Goga - Accenture Industrial SS
Formation - Python, Spark, and Hadoop for Big Data
The live examples