AJC FORMATION : 02. Etat de l'art du Big Data
Organisme
75009 PARIS 9Voir toutes ses formationsAutres organismes proposant cette formation
Durée
Modalités
- Classe virtuelle
- Présentiel
Evaluation des acquis : Les apprenants réalisent tout au long de la formation des exercices, QCM, mises en situation, TP, TD qui seront corrigés pour faciliter l’acquisition de compétences.
Prix
Public
Directeurs SI, Responsables SI, Chefs de projets, Architectes, Consultants ou toute personne amenée à participer à un projet Big Data …
Pré-requis
Avoir des connaissances de base des architectures techniques et du fonctionnement d’un système de gestion de base de données (SGBD).
Objectifs pédagogiques
Découvrir les principaux concepts du Big Data
Appréhender les avantages et les contraintes du Big Data
Comprendre les enjeux économiques du Big Data
Connaître l’écosystème du Big Data et appréhender les technologies associées
Savoir anticiper son intégration dans les activités informatiques de l’entreprise
Prendre en compte la sécurité et la confidentialité des données dans l’exploitation du Big Data
Programme détaillé
Introduction
▪ Introduction au Big Data : de quoi s'agit-il ?
▪ Exemples pratiques
▪ Les technologies concernées
▪ Les outils
▪ Les langages :
▪ Hortonworks
▪ MapR
▪ Cloudera
▪ IBM Watson
▪ Démystification du Big Data
▪ Les acteurs principaux
▪ Les différents métiers du Big Data (Administrateur, Architecte, Développeur, Data Analyst, Data Scientist, DPO, Data Owner, CDO…)
Enjeux et évolutions du Big Data
▪ La qualité des données
▪ Le traitement des données
▪ La protection des données
▪ L'image de la donnée
▪ L'humanité des données
Enjeux stratégiques et organisationnels
▪ Le challenge technique
▪ Investissement dans la capacité de stockage
▪ Investissement dans l'analyse
▪ Le Web sémantique
▪ Les nouvelles techniques de Data mining
▪ L'enjeux économique
▪ L'impact organisationnel
▪ La conduite du changement
▪ L'apparition de nouveaux métiers
▪ Etude de cas
Les technologies utilisées dans des projets Big Data
▪ Les outils de stockage
▪ L'écosystème Hadoop (Apache, Hortonworks, Cloudera, MapR, IBM, Oracle)
▪ Focus sur les outils
– Le paradigme MapReduce.
– Le système de gestion des fichiers distribués HDFS
– Echange de données via Sqoop, Flume, NIFI, Kafka
– Analyse des donnéees avec Pig et Hive
– Les bases NoSQL
– Ordonnanceur Hadoop : Oozie
– Moteur de recherche : Solr, ElasticSearch
– Spark : framework de calcul distribué in memory
▪ Les solutions de visualisation (Microstrategy, Tableau, QlikView …)
Sécurité, éthique et enjeux juridiques
▪ Assurer la protection des données
▪ L'anonymisation d'une donnée
▪ Le contrôle d'intégrité
▪ Le chiffrement d'une donnée
▪ Qu'est-ce que la blockchain
▪ Cas d'usage : Bitcoin
Travaux pratiques : Chaque participant doit trouver un sujet Big Data à réaliser
par un prestataire afin de créer une valeur.