Aller au contenu principal

PLB CONSULTANT : 02. Etat de l'art du Big Data

Organisme

PLB CONSULTANT
3-5 RUE MAURICE RAVEL
92300 LEVALLOIS PERRET
Voir toutes ses formationsAutres organismes proposant cette formation

Durée

14 heures

Modalités

Formation
  • Classe virtuelle
  • Présentiel
Évaluation

Démonstrations. QCM en cours et en fin de formation. Auto-évaluation en début et en fin de formation.

Prix

Inter
La formation en Inter est dispensée pour un groupe de salariés d’entreprises différentes.
588€ HT / personne
Intra
La formation en Intra est dispensée pour un groupe de salariés d’une seule et même entreprise.
2352€ HT / groupe
4 stagiaires minimum

Public

Directeurs SI, Responsables SI, Chefs de projets, Architectes, Consultants ou toute personne amenée à participer à un projet Big Data …

Pré-requis

Avoir des connaissances de base des architectures techniques et du fonctionnement d’un système de gestion de base de données (SGBD).

Objectifs pédagogiques

Découvrir les principaux concepts du Big Data

Appréhender les avantages et les contraintes du Big Data

Comprendre les enjeux économiques du Big Data

Connaître l’écosystème du Big Data et appréhender les technologies associées

Savoir anticiper son intégration dans les activités informatiques de l’entreprise

Prendre en compte la sécurité et la confidentialité des données dans l’exploitation du Big Data

Programme détaillé

Jour 1

Contexte et opportunités du Big Data

Définir les origines du Big Data

Envisager les données au coeur des enjeux

Explosion du nombre de données

Déterminer la place des objets connectés dans le Big Data

Identifier les types de données : structurées, semi-structurées, non structurées

Comment disposer de données de « qualité » ?

Appréhender les limites des architectures actuelles

Définition d’un système Big Data

Démonstration

Différences entre BI, Big Data et Data Science

Open data

Définir la philosophie des données ouvertes et les objectifs

Bénéfices escomptés

Déterminer une synergie avec le Big Data

Démonstration

Visites guidées de sites gouvernementaux proposant des gros volumes de données

L’écosystème de projets Big Data en entreprise

Définir les spécificités d’un projet Big Data

Lister les enjeux stratégiques et organisationnels

Comprendre comment l’innovation constante accélère le phénomène

Nouvelles technologies de transmission (vitesse de connexion accrue, mobiles en constante amélioration)

Objets connectés et domotique

Zoom sur le marché des biens et services proposés aux consommateurs

Fusionner les données exogènes et endogènes pour mieux comprendre les usagers

Méthodes de traitement de l’information : du traitement batch, au traitement temps réel

Architectures décisionnelles d’aujourd’hui

Les lacs de données (Datalake) en pleine émergence

Démonstration

Exemple de cahier des charges d’un projet Big Data

Technologie : Architecture et infrastructure Big Data

Cohabitation des solutions SGBDR et NoSQL

Les outils permettant d’extraire les données (ETL)

La nécessité de “nettoyer” les données (dataquality)

Exemple de traitement avec un ETL dédié Big data

L’apport d’un MDM (Master Data Manager)

Le stockage avec Hadoop (base de données Hbase, système de fichiers distribué HDFS)

Solutions big data alternatives (Sybase IQ, SAP Hana, Vectorwise, HP Vertica, etc.)

Démonstration

Schéma exemple d’architecture Big Data

 

Quiz d’évaluation des acquis de la journée

 

Jour 2

L’analyse des données et la visualisation

Définition de l’analyse statistique

Liens entre visualisation (Dataviz) et analyse

Synthèse des principaux outils de dataviz utilisés dans les projets

Quelques outils de traitements (Hive, etc.)

Analyse et traitement de données massives avec Spark

Comparaison avec Map Reduce

Recherche et analyse (Elastic Search, Splunk)

Les outils standard de reporting (Power BI, Tableau)

Les coûts cachés

Ce que propose l’IA dans un contexte Big Data pour l’analyse de données

Démonstration

Exemple d’utilisation de Elastic Search en entreprise pour disposer d’un tableau de bord de recherche et d’analyse sur les meilleurs ventes d’articles

Exemple de récupération et d’analyse de données dans un data lake par la solution Spark Hadoop

Exemples de rendus graphiques (reporting) autour de gros volume de données

 

Quiz de synthèse « quels outil pour quel traitement ? »

 

Sécurité éthique et enjeux juridiques du Big Data

Les données personnelles

Les informations sensibles, interdites de collecte

La CNIL régule les données numériques

Les accords intra-pays

Démonstration

Les points à surveiller dans les projets Big Data

Conclusion et cohabitation avec le SI existant

Comment répondre aux besoins de l'entreprise tout en conservant les acquis de l’existant ?

Doit-on cantonner le Big Data à une infrastructure de stockage ?

Spécificités de la Data science

Réflexion sur comment exposer mes datasets du Big Data à l'entreprise

Exemple d’architecture d’intégration

Les (nouveaux) métiers autour du Big Data)

Quelle sécurité doit-on mettre en place : intégration de l'annuaire, notion de Withelist, logique de l'API management… ?

Les risques d’un projet Big Data

Cas d’usage et success-stories

 

Quiz final d’évaluation des acquis

Sessions

Filtrer les résultats
Modalités pédagogiques
Formation synchrone se déroulant avec la présence physique du (des) formateur(s) et du (des) apprenant(s) réunis dans un même lieu de formation.
Formation combinant des séquences en présentiel et des séquences à distance synchrones ou asynchrones.
Formation à distance, asynchrone, s’appuyant sur une plateforme d’apprentissage, pouvant être complétée par d’autres modalités de formation à distance (visio-conférence…)
Formation à distance, synchrone, s’appuyant sur un dispositif de visio-conférence. La classe virtuelle recrée à distance les conditions d’une formation en salle traditionnelle.
Type de formation
La formation en Inter est dispensée pour un groupe de salariés d’entreprises différentes.
La formation en Intra est dispensée pour un groupe de salariés d’une seule et même entreprise.
Options
Les compétences professionnelles visées par la formation sont validées via un test permettant d’obtenir une certification officielle.
Ces sessions ne peuvent être ni annulées ni reportées par l’organisme de formation.