PLB CONSULTANT : 17. Big Data - Gestion de référentiels de données
Organisme
92300 LEVALLOIS PERRETVoir toutes ses formationsAutres organismes proposant cette formation
Durée
Modalités
- Classe virtuelle
- Présentiel
Études de cas. Travaux pratiques. QCM en cours et en fin de formation. Auto-évaluation en début et en fin de formation.
Prix
Public
Chefs de projet, Développeurs, Architectes SI, Concepteurs et Analystes, Data Governors…
Pré-requis
Avoir des connaissances générales en architecture SI
Objectifs pédagogiques
Comprendre le principe des données de référence (Master Data) et en identifier les enjeux
Appréhender l’impact des nouvelles architectures de données et du Big Data sur le Master Data
Connaitre les principales technologies, solutions et méthodes de gestion des données de référence
Mettre en place une méthode de gouvernance des données
Savoir identifier les acteurs du Master Data Management et leur rôle
Appréhender les outils et bonnes pratiques pour démarrer un projet de référentiel SI
Programme détaillé
Jour 1
Introduction au Master Data Management
Présentation croisée et attentes des participants
Concepts et glossaire du Master Data
Les données de référence
Définition des données de référence (Master Data)
Types et nature des données de référence
Les principaux référentiels du SI
Intérêts des données de référence
Travaux Pratiques
Étude de cas (classification des données de référence par type : maître, constitutive, paramètre)
L’architecture des référentiels SI
Rappels sur la cartographie fonctionnelle
Cartographie fonctionnelle type d’un référentiel de données
Les étapes pour construire une cartographie de qualité
Architecture applicative d’un référentiel SI
Travaux Pratiques
Étude d’une cartographie fonctionnelle d’un référentiel de données.
Gouvernance de la données, rôles et processus clés
Intérêts et nécessité de la gouvernance de la donnée
Cycle de Vie de la donnée (Data Lifecycle)
Rôles et compétences clés
Administration de la donnée
Processus clés de la gestion de la donnée de référence
Travaux Pratiques
Exemple de mise en oeuvre de processus concret pour gérer les données de référence.
Les référentiels au sein de leur écosystème SI
Écosystème type de la donnée de référence : DWH, CRM, Datalake...
Architecture d’intégration du Référentiel SI
Patterns d’accès aux données de références : Maître / Esclave, Copie locale, etc.
Mécanismes d’échanges des données de références : ETL, ESB, WS…
Travaux Pratiques
Utilisation d’un ETL pour échanger des données de références
Quiz de validation des acquis de la 1ère journée
Jour 2
Big Data et référentiels
Data Factory, Datalake, Datahub, Datalabs, NOSQL… et référentiels SI
Sécurité de la donnée
Disponibilité de la donnée
Politique de sauvegarde et d’archivage
Confidentialité et territorialité des données
Anonymisation de la donnée
Sécurité d’accès et habilitation
Travaux Pratiques
Exemple de stratégie d’entreprise pour sécuriser ses données (accès, sauvegarde, etc.)
Gestion de la qualité de la donnée - DQM
Sémantique de la donnée et metadata
Mode de nettoyage de la donnée
Le cas du dé-doublonnage
Service tiers et APIs de validation de la donnée
Travaux Pratiques
Visite guidée d’un logiciel de type DQM (Data Quality Manager) pour comprendre en quoi les fonctions d’un tel outil peuvent aider concrètement au quotidien à gérer la qualité des données
Démarche de construction d'un référentiel
Le projet de référentiel SI
Par quoi commencer ?
Principaux écueils et risques
Gouvernance : Acteurs, Sponsors, KPI…
Les 12 grandes règles du projet de référentiel SI
Travaux Pratiques
Étude de cas (construction d’un référentiel SI simplifié)
Quelles alternatives aux solutions éditeur
Bref aperçu du marché des solutions de MDM (Master Data Management)
Retour d’expérience
Les alternatives open-source
Conclusion