Accueil > Formations > Projet & Produit > Agilité, Scrum & Kanban > Spark

Agilité, Scrum & Kanban Niveau

Spark

Traitez les données massives en un temps record grâce au moteur d'analyse Apache Spark et à notre formation Spark !

5 sessions Eligible OPCO

Vue d'ensemble

Apache Spark est un moteur d'analyse unifié (Unified Analytics Engine), créé pour le traitement rapide des données. Ce framework open source de calcul distribué permet l'analyse et le traitement de données à grandes échelles. Le framework permet le développement d'applications de traitement hautement performantes. Notre formation Apache Spark vous permettra de développer des applications permettant de traiter de larges quantités de données en temps réel et l'intégrer notamment dans un environnement Hadoop pour améliorer le temps d'exécution des applications Hadoop !

Public visé

Scrum Masters & Coachs Agile

Prérequis

Connaissances basiques en Java, Scala ou Python, ainsi que sur Apache Hadoop

Objectifs pédagogiques

Expliquer le fonctionnement d'Apache Spark et ses relations avec le Big Data et Hadoop

Utiliser les RDD pour gérer les opérations et MapReduce

Intégrer et utiliser HDFS avec Spark

Mettre en place et déployer une structure de cluster Spark

Appliquer le partitionnement et la programmation parallèle sur les données HDFS

Concevoir et générer une application Spark

Implémenter Spark Streaming pour le traitement des données en temps réel

Appliquer des algorithmes de Machine Learning avec MLlib et optimiser Spark

Programme détaillé

Présentation et objectifs

Accueil des participants, présentation du programme et des objectifs pédagogiques. État des lieux des connaissances et attentes individuelles.

Introduction à l'écosystème data

Panorama du domaine : data engineering, data science, analytics, BI. Rôles et responsabilités dans une organisation data-driven.

Machine learning et IA

Concepts fondamentaux du ML : apprentissage supervisé/non supervisé, évaluation de modèles. Introduction au deep learning et au NLP.

Activités pratiques :

Entraînement d’un modèle de classification sur un dataset réel

Collecte et ingestion des données

Sources de données (bases, API, fichiers, streaming). Pipelines ETL/ELT, orchestration et qualité des données.

Activités pratiques :

Mise en place d’un pipeline d’ingestion de données

Stockage et modélisation

Data warehouses, data lakes, lakehouses. Modélisation dimensionnelle (Kimball), schémas en étoile et en flocon.

Activités pratiques :

Conception d’un modèle dimensionnel à partir d’un cas métier

Synthèse et certification

Récapitulatif des acquis de la formation. Conseils pour approfondir et prochaines étapes. Préparation à la certification le cas échéant.

Activités pratiques :

QCM de validation des acquis et évaluation de satisfaction

Prochaines sessions

29 juin 2026

Lyon - Français

Places dispo.

240 € HT

29 juin 2026

Distance - Français

Places dispo.

240 € HT

29 juin 2026

Grenoble - Français

Places dispo.

240 € HT

29 juin 2026

Toulouse - Français

Places dispo.

240 € HT

29 juin 2026

Aix-en-Provence - Français

Places dispo.

240 € HT

Avis des participants

4.5/5

Taux de satisfaction global 90%

Basé sur les retours stagiaires certifiés

Financement

Cette formation est éligible aux financements OPCO et FNE-Formation. Nos équipes vous accompagnent dans le montage de votre dossier.

En savoir plus sur le financement

Réf. SF33388

4.5/5

3 jours

5 sessions

Inter 240 € HT

Intra (≤12 pers.)

615 € HT

Choisissez votre modalité de formation

29 juin - 1 juil. 2026

Lyon

240 € HT

29 juin - 1 juil. 2026

Distance

240 € HT

29 juin - 1 juil. 2026

Grenoble

240 € HT

Demandez une intra-entreprise

Privatisez cette formation à vos dates dans vos locaux ou chez Sparks

615 € HT - Jusqu'à 8 personnes

Besoin d'une formation sur mesure ?

Adaptez cette formation à votre projet, où vous voulez, quand vous voulez

Télécharger la fiche PDF

Planifier un appel 20 min

Éligible OPCO Voir les modalités de financement

Besoin d'aide ? contact@sparks-formation.fr +33 1 23 45 67 89

Formations associées

Solutions Entreprises

Spark

Vue d'ensemble

Objectifs pédagogiques

Programme détaillé

Présentation et objectifs

Introduction à l'écosystème data

Machine learning et IA

Collecte et ingestion des données

Stockage et modélisation

Synthèse et certification

Prochaines sessions

Avis des participants

Financement

Choisissez votre modalité de formation

Formations associées

Test Driven Development (TDD) et eXtreme Programming (XP)

IQBBA Foundation Business Analyst, avec certification

Professional Scrum Master II (avec certification PSM 2)

Quel type de formation ?

Inter-entreprises

Intra-entreprise

Sur-mesure

Spark

Vue d'ensemble

Objectifs pédagogiques

Programme détaillé

Présentation et objectifs

Introduction à l'écosystème data

Machine learning et IA

Collecte et ingestion des données

Stockage et modélisation

Synthèse et certification

Prochaines sessions

Avis des participants

Financement

Choisissez votre modalité de formation

Formations associées

Test Driven Development (TDD) et eXtreme Programming (XP)

IQBBA Foundation Business Analyst, avec certification

Professional Scrum Master II (avec certification PSM 2)

Demandez votre devis

Quel type de formation ?

Inter-entreprises

Intra-entreprise

Sur-mesure