PLB CONSULTANT : 02. Etat de l'art du Big Data
Organisme
92300 LEVALLOIS PERRETVoir toutes ses formationsAutres organismes proposant cette formation
Durée
Modalités
- Classe virtuelle
- Présentiel
Démonstrations. QCM en cours et en fin de formation. Auto-évaluation en début et en fin de formation.
Prix
Public
Directeurs SI, Responsables SI, Chefs de projets, Architectes, Consultants ou toute personne amenée à participer à un projet Big Data …
Pré-requis
Avoir des connaissances de base des architectures techniques et du fonctionnement d’un système de gestion de base de données (SGBD).
Objectifs pédagogiques
Découvrir les principaux concepts du Big Data
Appréhender les avantages et les contraintes du Big Data
Comprendre les enjeux économiques du Big Data
Connaître l’écosystème du Big Data et appréhender les technologies associées
Savoir anticiper son intégration dans les activités informatiques de l’entreprise
Prendre en compte la sécurité et la confidentialité des données dans l’exploitation du Big Data
Programme détaillé
Jour 1
Contexte et opportunités du Big Data
Définir les origines du Big Data
Envisager les données au coeur des enjeux
Explosion du nombre de données
Déterminer la place des objets connectés dans le Big Data
Identifier les types de données : structurées, semi-structurées, non structurées
Comment disposer de données de « qualité » ?
Appréhender les limites des architectures actuelles
Définition d’un système Big Data
Démonstration
Différences entre BI, Big Data et Data Science
Open data
Définir la philosophie des données ouvertes et les objectifs
Bénéfices escomptés
Déterminer une synergie avec le Big Data
Démonstration
Visites guidées de sites gouvernementaux proposant des gros volumes de données
L’écosystème de projets Big Data en entreprise
Définir les spécificités d’un projet Big Data
Lister les enjeux stratégiques et organisationnels
Comprendre comment l’innovation constante accélère le phénomène
Nouvelles technologies de transmission (vitesse de connexion accrue, mobiles en constante amélioration)
Objets connectés et domotique
Zoom sur le marché des biens et services proposés aux consommateurs
Fusionner les données exogènes et endogènes pour mieux comprendre les usagers
Méthodes de traitement de l’information : du traitement batch, au traitement temps réel
Architectures décisionnelles d’aujourd’hui
Les lacs de données (Datalake) en pleine émergence
Démonstration
Exemple de cahier des charges d’un projet Big Data
Technologie : Architecture et infrastructure Big Data
Cohabitation des solutions SGBDR et NoSQL
Les outils permettant d’extraire les données (ETL)
La nécessité de “nettoyer” les données (dataquality)
Exemple de traitement avec un ETL dédié Big data
L’apport d’un MDM (Master Data Manager)
Le stockage avec Hadoop (base de données Hbase, système de fichiers distribué HDFS)
Solutions big data alternatives (Sybase IQ, SAP Hana, Vectorwise, HP Vertica, etc.)
Démonstration
Schéma exemple d’architecture Big Data
Quiz d’évaluation des acquis de la journée
Jour 2
L’analyse des données et la visualisation
Définition de l’analyse statistique
Liens entre visualisation (Dataviz) et analyse
Synthèse des principaux outils de dataviz utilisés dans les projets
Quelques outils de traitements (Hive, etc.)
Analyse et traitement de données massives avec Spark
Comparaison avec Map Reduce
Recherche et analyse (Elastic Search, Splunk)
Les outils standard de reporting (Power BI, Tableau)
Les coûts cachés
Ce que propose l’IA dans un contexte Big Data pour l’analyse de données
Démonstration
Exemple d’utilisation de Elastic Search en entreprise pour disposer d’un tableau de bord de recherche et d’analyse sur les meilleurs ventes d’articles
Exemple de récupération et d’analyse de données dans un data lake par la solution Spark Hadoop
Exemples de rendus graphiques (reporting) autour de gros volume de données
Quiz de synthèse « quels outil pour quel traitement ? »
Sécurité éthique et enjeux juridiques du Big Data
Les données personnelles
Les informations sensibles, interdites de collecte
La CNIL régule les données numériques
Les accords intra-pays
Démonstration
Les points à surveiller dans les projets Big Data
Conclusion et cohabitation avec le SI existant
Comment répondre aux besoins de l'entreprise tout en conservant les acquis de l’existant ?
Doit-on cantonner le Big Data à une infrastructure de stockage ?
Spécificités de la Data science
Réflexion sur comment exposer mes datasets du Big Data à l'entreprise
Exemple d’architecture d’intégration
Les (nouveaux) métiers autour du Big Data)
Quelle sécurité doit-on mettre en place : intégration de l'annuaire, notion de Withelist, logique de l'API management… ?
Les risques d’un projet Big Data
Cas d’usage et success-stories