Mondher Formation

🎯 Formation : Data Analyste Big Data (50h)

🎯 1. Objectifs de la formation

À la fin de cette formation, le participant sera capable de :

  • Comprendre les concepts fondamentaux du Big Data
  • Manipuler et analyser des données avec Python
  • Utiliser des outils d’analyse comme Power BI
  • Interroger des bases de données avec SQL
  • Traiter des volumes de données importants avec Apache Spark
  • Construire des tableaux de bord interactifs
  • Réaliser un mini-projet Data Analyst complet

👥 2. Public cible

  • Étudiants en informatique, gestion, statistiques
  • Développeurs souhaitant évoluer vers la Data
  • Analystes métier (finance, marketing…)
  • Toute personne souhaitant devenir Data Analyst

Prérequis :

  • Bases en informatique
  • Notions de logique / mathématiques
  • Aucun niveau avancé requis en programmation

🕒 3. Durée et organisation

  • Durée totale : 50 heures
  • Format : présentiel ou à distance
  • Approche : théorie (30%) + pratique (70%)

📚 4. Programme détaillé (50h)


🔹 Module 1 : Introduction au Big Data (4h)

  • Définition du Big Data
  • Les 5V (Volume, Vélocité, Variété, Véracité, Valeur)
  • Architecture Big Data
  • Rôle du Data Analyst

🔹 Module 2 : Bases de données & SQL (8h)

  • Introduction aux bases de données relationnelles
  • Modèle relationnel
  • Requêtes SQL :
    • SELECT, WHERE, ORDER BY
    • JOIN (INNER, LEFT…)
    • GROUP BY, HAVING
  • Mini TP pratique avec MySQL

🔹 Module 3 : Analyse de données avec Python (12h)

  • Introduction à Python
  • Librairies principales :
    • NumPy
    • Pandas
    • Matplotlib
  • Nettoyage et transformation des données
  • Analyse exploratoire (EDA)
  • TP : analyse d’un dataset réel

🔹 Module 4 : Data Visualization (6h)

  • Principes de visualisation
  • Création de dashboards avec Power BI
  • Graphiques :
    • histogrammes
    • courbes
    • cartes
  • TP : tableau de bord interactif

🔹 Module 5 : Big Data & Apache Spark (10h)

  • Introduction à Hadoop
  • Concepts de Apache Spark
  • Traitement distribué
  • Spark avec Python (PySpark)
  • Manipulation de données volumineuses
  • TP pratique

🔹 Module 6 : Projet Data Analyst (8h)

  • Étude de cas réelle :
    • nettoyage des données
    • analyse
    • visualisation
  • Création d’un dashboard
  • Présentation du projet

🔹 Module 7 : Bonnes pratiques & métiers (2h)

  • Méthodologie d’analyse
  • Data storytelling
  • Introduction aux métiers :
    • Data Analyst
    • Data Engineer
    • Data Scientist

🧪 5. Méthodologie pédagogique

  • Cours interactifs
  • Travaux pratiques (TP)
  • Études de cas réels
  • Mini-projets
  • Projet final

📊 6. Évaluation

  • Exercices pratiques
  • Quiz
  • Projet final (présentation + dashboard)

🏆 7. Résultats attendus

À la fin, le participant pourra :

  • Analyser des données réelles
  • Créer des dashboards professionnels
  • Utiliser des outils Big Data
  • Se préparer à des certifications (ex : Power BI)