Intelligence Émotionnelle & QVT Niveau

PySpark

Maîtrisez PySpark pour traiter et analyser des volumes massifs de données !

1 session Eligible OPCO

Vue d'ensemble

Les métiers de Data Engineer et Data Analyst sont de plus en plus présents au sein des entreprises. Leur rôle est d'extraire de la valeur à partir de la donnée préparée et enrichie afin d'en tirer des informations métiers utiles. Pour faire face à la complexité et au volume de données à traiter toujours plus grand, il est essentiel de maîtriser un langage de programmation pour extraire, stocker et manipuler ces données. Le langage Python, très polyvalent, permet d'effectuer des analyses statistiques à partir des données. Cette formation vous présentera les bases de PySpark pour une prise en main rapide de vos données à travers des scripts, ainsi que le cycle complet de création d'un pipeline de données.
Public visé
Prérequis

Notions de base sur le langage Python ; notions sur les environnements data (modèle en étoile, Azure)

Objectifs pédagogiques

Manipuler des données massives avec Python et PySpark pour effectuer des analyses de données
Expliquer l'architecture de PySpark et ses interactions avec les systèmes de stockage distribués tels qu'Azure Data Lake
Configurer la connexion à des bases de données SQL Server et interagir avec elles via PySpark
Concevoir un pipeline de transformation de données complet intégrant nettoyage, transformation et chargement en base de données

Programme détaillé

Prochaines sessions

2 juil. 2026

Distance - Français

Places dispo.
140 € HT

Avis des participants

4.6/5
Taux de satisfaction global 92%
Basé sur les retours stagiaires certifiés

Financement

Cette formation est éligible aux financements OPCO et FNE-Formation. Nos équipes vous accompagnent dans le montage de votre dossier.

En savoir plus sur le financement