Aller au contenu principal
Afficher le fil d'ariane

LE PONT LEARNING : 1. Enjeux et perspectives du Big Data

Organisme

LE PONT LEARNING
97 RUE ANATOLE FRANCE
92300 LEVALLOIS-PERRET
Voir toutes ses formationsAutres organismes proposant cette formation

Durée

14 heures

Modalités

Formation

  • Classe virtuelle
  • Présentiel

Évaluation

Auto-évaluation des acquis par le stagiaire via un questionnaire en ligne

Prix

Inter
La formation en Inter est dispensée pour un groupe de salariés d’entreprises différentes.
720€ HT / personne
Intra
La formation en Intra est dispensée pour un groupe de salariés d’une seule et même entreprise.
3600€ HT / groupe
4 stagiaires minimum

Public

Développeurs, concepteurs, Architectes, Data/business Analysts, Data scientists, chefs de projets, directeurs de projets, consultant SI.

Pré-requis

Avoir une connaissance générale en systèmes d'information.

Objectifs pédagogiques

Pour consulter les objectifs pédagogiques, merci de vous référer au programme détaillé de chaque stage.

Programme détaillé

Big Data : enjeux et opportunités / évolution des données

  • Le Big Data et ses 4 grands défis : volume, variété, vélocité, véracité.
  • Données massives : Web, réseaux sociaux, Open Data, capteurs, données industrielles.
  • Ouverture des données publiques : le mouvement Open Data.
  • Variété, distribution, mobilité des données sur Internet.
  • Vélocité et flux continus de données.
  • Le Edge Computing, vers une informatique de flux

Les enjeux pour les entreprises

  • Le processus de création de valeur grâce au Big Data
  • Véracité des données provenant de sources variées pour la prise de décision.
  • Analyses complexes sur Big Data, Big Analytics.
  • Production d'informations en temps réel à partir de Big Data.
  • Réactivité : traitement de flux de données en temps réel, Complex Event Processing (CEP).
  • Définir sa stratégie de déploiement : Cloud, "on-premise" ou hybride

Opportunités offertes par les progrès matériels

  • Le stockage : Disques durs HDD vs SSD "on premise" et stockage objet ou bloc dans le Cloud.
  • L'impact de la baisse du coût de la mémoire : l'avènement du traitement de données in-memory
  • Couplage CPU/GPU pour une meilleure optimisation du calcul parallèle.
  • Les stratégies de stockage disque en réseau NAS/SAN/Isilon (stockage élastique) : Quels impacts sur les architectures de gestion de données ?
  • Les architectures massivement parallèles (MPP) vs Hadoop
  • Les appliances.

Compréhension des technologies utilisées / motivations

  • Le théorème CAP (Consistency, Availability, Partition tolerance) : analyse et impact.
  • La pile logicielle Big Data (la "stack Hadoop")
  • Les fondamentaux des Big Data
  • L'organisation fonctionnelle et les principaux composants : stockage, organisation, traitement, intégration, outils d'analyse.
  • La gestion de clusters.
  • Les "design pattern" d'Hadoop (architectures Lambda, Kappa, Omega, etc.), pour répondre à quels usages
  • Comparaison avec les SGBD relationnels.

Les différentes méthodologies adaptées au Big Data

  • La gouvernance des projets Big Data

      Qu'est-ce que la Gouvernance des données

  • Gouvernance des projets
  • Organisation et rôles
  • Les grands principes des méthodes agiles
  • Le design thinking pourquoi est-il adapté aux enjeux du Big data ?

      Les principes de base du design thinking

  • Les méthodes de développement
  • Les impacts sur l'organisation d'une DSI (privilégier la conception collaborative)
  • Intégrer les métiers dès la phase de conception
  • Définir les différents ateliers (modeling, intercation design, prototypage)

La sécurité du Big Data

  • Les 5 cercles de défense du Big Data
  • Protection de la donnée
  • Sécurité périmétrique
  • Gestion des authentifications
  • Gestion des autorisations
  • Sécurité du système d'exploitation

Utilisation de la cryptographie

  • Comprendre les fondamentaux (cryptographie, cryptanalyse, kleptographie, etc.).
  • Les trois approches de gestion des clés de chiffrement dans une architecture Big Data.
  • Les enjeux du chiffrement homomorphe.
  • Les outils de data management de la donnée
  • Le chiffrement à la volée avec préservation de format.
  • Les bonnes pratiques en matière de chiffrement et les recommandations de l'ANSSI et de l'ENISA.

Autres techniques de protection des données

  • Comprendre le cycle de vie des données dans une architecture Big Data.
  • Les outils en charge de la gouvernance et du cycle de vie des données
  • La classification des données. L'importance de la classification dans les projets Big Data.
  • L'anonymisation et la pseudonymisation des données.

Éthique et enjeux juridiques / principes généraux de conformité et de responsabilités

  • Responsabilités sur le plan Informatique et Libertés
  • Responsabilités sur le plan identités
  • Responsabilités sur le plan régulation
  • Responsabilités sur le plan économique
  • Responsabilités sur le plan sécurité
  • Responsabilités sur le plan patrimoine
  • Responsabilités sur le plan de l'archivage
  • Responsabilités sur le plan ressources humaines

Cas d'usage, retours d'expériences

Méthodologie pour aider l'entreprise à devenir Data Centric, c'est-à-dire en partant de zéro, comment se former, se transformer, choisir sa distribution Hadoop, l'installer, la paramétrer, préparer la gouvernance et préparer les premiers usages.

Sessions

Filtrer les résultats

35 résultats

Modalités pédagogiques
Formation synchrone se déroulant avec la présence physique du (des) formateur(s) et du (des) apprenant(s) réunis dans un même lieu de formation.
Formation combinant des séquences en présentiel et des séquences à distance synchrones ou asynchrones.
Formation à distance, asynchrone, s’appuyant sur une plateforme d’apprentissage, pouvant être complétée par d’autres modalités de formation à distance (visio-conférence…)
Formation à distance, synchrone, s’appuyant sur un dispositif de visio-conférence. La classe virtuelle recrée à distance les conditions d’une formation en salle traditionnelle.
Type de formation
La formation en Inter est dispensée pour un groupe de salariés d’entreprises différentes.
La formation en Intra est dispensée pour un groupe de salariés d’une seule et même entreprise.
Options
Ces sessions ne peuvent être ni annulées ni reportées par l’organisme de formation.

0 résultat