Programa del Curso
Introducción
- Información general sobre las características y la arquitectura de Spark y Hadoop
- Entendiendo el big data
- Python Conceptos básicos de programación
Empezar
- Configuración de Python, Spark y Hadoop
- Descripción de las estructuras de datos en Python
- Descripción de la API PySpark
- Descripción de HDFS y MapReduce
Integración de Spark y Hadoop con Python
- Implementación de Spark RDD en Python
- Procesamiento de datos mediante MapReduce
- Creación de conjuntos de datos distribuidos en HDFS
Machine Learning con Spark MLlib
Procesamiento Big Data con Spark Streaming
Trabajar con sistemas de recomendación
Trabajar con Kafka, Sqoop, Kafka y Flume
Apache Mahout con Spark y Hadoop
Solución de problemas
Resumen y próximos pasos
Requerimientos
- Experiencia con Spark y Hadoop
- Python Experiencia en programación
Audiencia
- Científicos de datos
- Desarrolladores
Testimonios (3)
The fact that we were able to take with us most of the information/course/presentation/exercises done, so that we can look over them and perhaps redo what we didint understand first time or improve what we already did.
Raul Mihail Rat - Accenture Industrial SS
Curso - Python, Spark, and Hadoop for Big Data
I liked that it managed to lay the foundations of the topic and go to some quite advanced exercises. Also provided easy ways to write/test the code.
Ionut Goga - Accenture Industrial SS
Curso - Python, Spark, and Hadoop for Big Data
The live examples