Plan du cours

Introduction

  • Vue d'ensemble de Spark et Hadoop caractéristiques et architecture
  • Comprendre le big data
  • Python bases de la programmation

Pour commencer

  • Configurer Python, Spark et Hadoop
  • Comprendre les structures de données dans Python
  • Comprendre l'API PySpark
  • Comprendre HDFS et MapReduce

Intégrer Spark et Hadoop à Python

  • Implémenter Spark RDD dans Python
  • Traiter les données à l'aide de MapReduce
  • Créer des ensembles de données distribués dans HDFS

Spark et Spark MLlib Machine Learning avec Spark MLlib

Traiter Big Data avec Spark Streaming

Travailler avec des systèmes de recommandation

Travailler avec Kafka, Sqoop, Kafka et Flume

Apache Mahout avec Spark et Hadoop

Résolution des problèmes

Résumé et prochaines étapes

Pré requis

  • Expérience avec Spark et Hadoop
  • Python expérience en programmation

Audience

  • Scientifiques des données
  • Développeurs
 21 Heures

Nombre de participants


Prix ​​par Participant

Nos clients témoignent (3)

Cours à venir

Catégories Similaires