Gracias por enviar su consulta! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.
Gracias por enviar su reserva! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.
Programa del Curso
1: HDFS (17%)
- Describir la función de los demonios HDFS
- Describir el funcionamiento normal de un clúster Apache Hadoop, tanto en el almacenamiento de datos como en el procesamiento de datos.
- Identificar las características actuales de los sistemas informáticos que motivan un sistema como Apache Hadoop.
- Clasificar los principales objetivos del diseño de HDFS
- Dado un escenario, identifique el caso de uso adecuado para la federación de HDFS
- Identificación de componentes y demonios de un clúster de alta disponibilidad de HDFS
- Análisis de la función de la seguridad de HDFS (Kerberos)
- Determinar la mejor opción de serialización de datos para un escenario determinado
- Descripción de las rutas de lectura y escritura de archivos
- Identifique los comandos para manipular archivos en el shell del sistema de archivos Hadoop
2: YARN y MapReduce versión 2 (MRv2) (17%)
- Comprender cómo afecta la actualización de un clúster de Hadoop 1 a Hadoop 2 a la configuración del clúster
- Comprender cómo implementar MapReduce v2 (MRv2 / YARN), incluidos todos los demonios de YARN
- Comprender la estrategia de diseño básica para MapReduce v2 (MRv2)
- Determinar cómo YARN maneja las asignaciones de recursos
- Identificar el flujo de trabajo del trabajo de MapReduce que se ejecuta en YARN
- Determine qué archivos debe cambiar y cómo para migrar un clúster de la versión 1 de MapReduce (MRv1) a la versión 2 de MapReduce (MRv2) que se ejecuta en YARN.
3: Hadoop Planificación de clústeres (16%)
- Principales puntos a tener en cuenta a la hora de elegir el hardware y los sistemas operativos para alojar un clúster Apache Hadoop.
- Analice las opciones para seleccionar un sistema operativo
- Comprender el ajuste del kernel y el intercambio de discos
- Dado un escenario y un patrón de carga de trabajo, identifique una configuración de hardware adecuada para el escenario
- En un escenario, determine los componentes del ecosistema que el clúster debe ejecutar para cumplir el Acuerdo de Nivel de Servicio
- Tamaño del clúster: dado un escenario y una frecuencia de ejecución, identifique los detalles de la carga de trabajo, incluida la CPU, la memoria, el almacenamiento y la E/S de disco
- Dimensionamiento y configuración de discos, incluidos los requisitos de JBOD frente a RAID, SAN, virtualización y tamaño de disco en un clúster
- Topologías de red: comprenda el uso de la red en Hadoop (tanto para HDFS como para MapReduce) y proponga o identifique los componentes clave del diseño de la red para un escenario determinado
4: Hadoop Instalación y administración de clústeres (25%)
- En un escenario, identifique cómo el clúster controlará los errores de disco y máquina
- Análisis de una configuración de registro y un formato de archivo de configuración de registro
- Comprender los conceptos básicos de las métricas Hadoop y la supervisión del estado del clúster
- Identificar la función y el propósito de las herramientas disponibles para el monitoreo de clústeres
- Ser capaz de instalar todos los componentes del ecosistema en CDH 5, incluidos (pero no limitados a): Impala, Flume, Oozie, Hue, Manager, Sqoop, Hive y Pig
- Identificar la función y el propósito de las herramientas disponibles para administrar el sistema de archivos Apache Hadoop
5: Recurso Management (10%)
- Comprender los objetivos generales de diseño de cada uno de los Hadoop programadores
- En un escenario, determine cómo el programador FIFO asigna los recursos del clúster
- En un escenario, determine cómo el Programador justo asigna los recursos del clúster en YARN
- En un escenario, determine cómo el programador de capacidad asigna los recursos del clúster
6: Monitoreo y registro (15%)
- Comprender las funciones y características de las capacidades de recopilación de métricas de Hadoop
- Analice las interfaces de usuario web de NameNode y JobTracker
- Descripción general de la supervisión de demonios de clúster
- Identifique y supervise el uso de la CPU en los nodos maestros
- Describir cómo supervisar el intercambio y la asignación de memoria en todos los nodos
- Identificar cómo ver y administrar los archivos de registro de Hadoop
- Interpretación de un archivo de registro
Requerimientos
- Habilidades básicas Linux de administración
- Conocimientos básicos de programación
35 Horas
Testimonios (3)
I genuinely enjoyed the many hands-on sessions.
Jacek Pieczątka
Curso - Administrator Training for Apache Hadoop
I genuinely enjoyed the big competences of Trainer.
Grzegorz Gorski
Curso - Administrator Training for Apache Hadoop
I mostly liked the trainer giving real live Examples.