Accueil > Formations > Projet & Produit > Agilité, Scrum & Kanban > Spark
Spark
Traitez les données massives en un temps record grâce au moteur d'analyse Apache Spark et à notre formation Spark !
Vue d'ensemble
Connaissances basiques en Java, Scala ou Python, ainsi que sur Apache Hadoop
Objectifs pédagogiques
Programme détaillé
Présentation et objectifs
Accueil des participants, présentation du programme et des objectifs pédagogiques. État des lieux des connaissances et attentes individuelles.
Introduction à l'écosystème data
Panorama du domaine : data engineering, data science, analytics, BI. Rôles et responsabilités dans une organisation data-driven.
Machine learning et IA
Concepts fondamentaux du ML : apprentissage supervisé/non supervisé, évaluation de modèles. Introduction au deep learning et au NLP.
Entraînement d’un modèle de classification sur un dataset réel
Collecte et ingestion des données
Sources de données (bases, API, fichiers, streaming). Pipelines ETL/ELT, orchestration et qualité des données.
Mise en place d’un pipeline d’ingestion de données
Stockage et modélisation
Data warehouses, data lakes, lakehouses. Modélisation dimensionnelle (Kimball), schémas en étoile et en flocon.
Conception d’un modèle dimensionnel à partir d’un cas métier
Synthèse et certification
Récapitulatif des acquis de la formation. Conseils pour approfondir et prochaines étapes. Préparation à la certification le cas échéant.
QCM de validation des acquis et évaluation de satisfaction
Prochaines sessions
29 juin 2026
Lyon - Français
29 juin 2026
Distance - Français
29 juin 2026
Grenoble - Français
29 juin 2026
Toulouse - Français
29 juin 2026
Aix-en-Provence - Français
Avis des participants
Financement
Cette formation est éligible aux financements OPCO et FNE-Formation. Nos équipes vous accompagnent dans le montage de votre dossier.
En savoir plus sur le financement
