Návrh Školení
Úvod do Apache Spark
- Role Sparku ve zpracování velkých dat
- Jiskrová architektura a její součásti
Nastavení Apache Spark
- Hardwarové a softwarové požadavky
- Instalační postupy pro samostatný a clusterový režim
- Doporučené postupy konfigurace pro správce systému
Správa Spark Clusters
- Nástroje a techniky pro správu klastrů
- Monitorování aplikací Spark a prostředků clusteru
- Konfigurace zabezpečení a správa uživatelů
Ladění a optimalizace výkonu
- Alokace a plánování zdrojů
- Tuning Spark pro optimální výkon
- Identifikace a řešení běžných úzkých míst
Odstraňování problémů a řešení problémů
- Běžné výzvy správy Spark
- Diagnostické nástroje a techniky pro odstraňování problémů
- Postupný přístup k řešení běžných problémů
- Nejlepší postupy pro udržování zdravého prostředí Spark
Pokročilá administrační témata
- Integrace s dalšími nástroji pro velká data
- Zajištění vysoké dostupnosti a obnovy po havárii
- Upgrade a škálování clusterů Spark
Shrnutí a další kroky
Požadavky
- Základní znalost konfigurace a správy sítě
- Znalost Linux operačního systému a rozhraní příkazového řádku
- Zájem o studium distribuovaných výpočetních systémů a správy velkých dat
Publikum
- Správci systému
Reference (5)
Spousta praktických příkladů, různé způsoby, jak přistupovat ke stejnému problému, a někdy ne tak samozřejmé triky, jak stávající řešení vylepšit
Rafał - Nordea
Kurz - Apache Spark MLlib
Machine Translated
The live examples
Ahmet Bolat - Accenture Industrial SS
Kurz - Python, Spark, and Hadoop for Big Data
very interactive...
Richard Langford
Kurz - SMACK Stack for Data Science
Sufficient hands on, trainer is knowledgable
Chris Tan
Kurz - A Practical Introduction to Stream Processing
Get to learn spark streaming , databricks and aws redshift