Spark (3 Jours) - ref : BGS
Introduction
Cette formation sur 3 jours permet d'appréhender le Framework Spark. Les stagiaires se formeront à la collecte, le stockage, le traitement de données hétérogènes avec Spark. Il s'agira toujours avec Spark d'intégrer ces chaînes de traitement à un système d'information. Cette formation est à 30% théorique et à 70% pratique.
Objectifs pédagogiques
- Concepts fondamentaux de Spark
- Applications avec Spark Streaming
- Programmation parallèle avec Spark sur un cluster
- Exploitation des données avec Spark SQL
- Introduction au Machine Learning
Participants
Développeur, architecte
Pré-requis
Bonnes connaissances du langage Java.
Programme
- Présentation du Framework Apache Spark
- Programmer avec les Resilient Distributed Dataset (RDD)
- Manipuler des données structurées avec Spark SQL
- Spark sur un cluster
- Analyser en temps réel avec Spark Streaming
- Graphes avec GraphX
- Machine Learning avec Spark