Aller au contenu principal
Afficher le fil d'ariane

LE PONT LEARNING : 5. Concevoir et piloter un projet Big Data

Organisme

LE PONT LEARNING
97 RUE ANATOLE FRANCE
92300 LEVALLOIS-PERRET
Voir toutes ses formationsAutres organismes proposant cette formation

Durée

21 heures

Modalités

Formation

  • Classe virtuelle
  • Présentiel

Évaluation

Auto-évaluation des acquis par le stagiaire via un questionnaire en ligne

Prix

Inter
La formation en Inter est dispensée pour un groupe de salariés d’entreprises différentes.
900€ HT / personne
Intra
La formation en Intra est dispensée pour un groupe de salariés d’une seule et même entreprise.
5100€ HT / groupe
4 stagiaires minimum

Public

Chefs de projets, directeurs de projets, directeurs en système d'information, Architectes fonctionnels ou techniques.

Pré-requis

Expérience en gestion de projet

Objectifs pédagogiques

Pour consulter les objectifs pédagogiques, merci de vous référer au programme détaillé de chaque stage.

Programme détaillé

  • Programme de 14h sur 2 jours

 

Comprendre et traiter les spécificités d'un projet Big Data au sens organisationnel, méthodologique, technologique, économique, juridique et humain

  • Bâtir une vision Data Centric pour l'entreprise
  • Etudier l'environnement concurrentiel de l'entreprise
  • Comment créer de la valeur ou apporter de la valeur complémentaire aux données
  • Comment utiliser les Big Data qui doivent être un levier technologique pour accompagner les enjeux métiers et non l'inverse
  • Comprendre les acteurs du Big Data et leur positionnement
  • Quelle Gouvernance mettre en place
  • Quel impact dans la relation DSI / Métiers
  • L'émergence de la culture DevOPS
  • Les nouvelles méthodologies de développement
  • Découvrir le Visual Thinking
  • Les impacts organisationnels
  • Comment positionner le Big Data face à l'existant ?
  • Quelles sont les possibilités offertes par le Big Data ?
  • La gestion des données personnelles
  • Surveillance et sanctions de la CNIL
  • Les nouveaux profils du Big Data
  • Présentation de l'Ecosysteme Hadoop et des distributions du marché
  • Concepts des Systèmes NoSql

Composer et piloter une équipe Big Data

  • Définition des profils en fonction des typologies de projet
  • Les nouveaux profils du Big Data
  • L'architecte des données
  • Le Data Steward
  • L'administrateur Hadoop
  • Le Data Scientist
  • Le Data Analyst
  • Les développeurs Java Hadoop
  • Les développeurs apache Spark

Manager le processus de mise en place d'un projet Big Data

  • Le cadrage du projet
  • Cadrage métier identification des cas d'usages
  • Cadrage technique identification des cas d'usage
  • Identification des sources de données
  • Évaluation des besoins technologiques
  • Estimation budgétaire et planification projet
  • Management de projet Big Data
  • Définition de la méthodologie de gestion de projet
  • Mise en place de la structure de gouvernance du projet
  • Définition de la liste des livrables
  • Traitement des obligations juridiques: CNIL, propriétés intellectuelles
  • Compétences & organisation des projets Big Data
  • Identification des compétences nécessaires
  • Mise en place des différentes équipes projet (profils DSI, experts métiers, Data Scientists et Data Steward)
  • Mise en place des outils de pilotage
  • Déploiement des outils de data préparation
  • Mise en place des outils d'alimentation
  • Modélisation de la structure d'accueil des données au sein du Data Lake (landing area)
  • Mise en place des outils de développements (externe à la plateforme Big data si nécessaire)
  • Mise en place des outils d'exposition des données

Piloter et maîtriser les risques des projets Big Data

  • Les enjeux réglementaires et la conformité : la dimension "Gouvernance" du projet
  • La disponibilité effective des données (en regard des différents contrats souscrits auprès des fournisseurs de données)
  • La maîtrise du format des données
  • La disponibilité des acteurs en charge de vous fournir les données
  • Anticiper la volumétrie attendue
  • Savoir correctement modéliser la structure d'accueil des données
  • Avoir une bonne vision des traitements à effectuer et leur performance en regard de la volumétrie attendue
  • Choisir avec soin son outil de modélisation prédictif (capable de gérer une forte volumétrie)
  • Maîtriser sa solution de datavisualisation et s'assurer de sa compatibilité avec le Big Data

Tests et analyses de performances

Tests de performances

      Objectif : Tests sur un ou plusieurs scénarios sous une charge modérée du système complet et/ou d'un sous-système nécessitant un point d'attention

  • Exemple : La souscription est testée pour 1 utilisateur et, pour chaque étape du use case, on mesure le temps passé dans les différents composants de l'application
  • Test de vieillissement

      Objectif : Déterminer la capacité de l'application à fonctionner sur une période étendue

  • Exemple : On simule l'utilisation de l'application pendant 48h, avec une charge constante et égale à la charge moyenne
  • Test de charge

      Objectif : Mesurer la tenue en charge de l'application sur la population cible

  • Exemple : On simule l'utilisation de l'application par 200 utilisateurs (avec des scénarios différents) en parallèle pendant 2h
  • Test de rupture / Stress test

      Objectif : Déterminer les limites de l'application

  • Exemple : On augmente le nombre d'utilisateurs en parallèle sur l'application jusqu'à ce que le taux d'erreurs / les temps de réponse ne soient plus acceptables
  • Choix des scénarios
  • Choix des métriques
  • Choix de l'outillage

Etudes de cas / mises en situation

Mission de choix d'outil et montée en compétence

Déploiement de distributions Hadoop différente et réalisation d'un test de performance

Sessions

Filtrer les résultats

36 résultats

Modalités pédagogiques
Formation synchrone se déroulant avec la présence physique du (des) formateur(s) et du (des) apprenant(s) réunis dans un même lieu de formation.
Formation combinant des séquences en présentiel et des séquences à distance synchrones ou asynchrones.
Formation à distance, asynchrone, s’appuyant sur une plateforme d’apprentissage, pouvant être complétée par d’autres modalités de formation à distance (visio-conférence…)
Formation à distance, synchrone, s’appuyant sur un dispositif de visio-conférence. La classe virtuelle recrée à distance les conditions d’une formation en salle traditionnelle.
Type de formation
La formation en Inter est dispensée pour un groupe de salariés d’entreprises différentes.
La formation en Intra est dispensée pour un groupe de salariés d’une seule et même entreprise.
Options
Ces sessions ne peuvent être ni annulées ni reportées par l’organisme de formation.

0 résultat