PLB CONSULTANT : 16. Big Data - Qualité des données
Organisme
92300 LEVALLOIS PERRETVoir toutes ses formationsAutres organismes proposant cette formation
Durée
Modalités
- Classe virtuelle
- Présentiel
Travaux pratiques. QCM en cours et en fin de formation. Auto-évaluation en début et en fin de formation.
Prix
Public
Data Quality Analysts, Consultants, Architectes SI, Chefs de projet, Responsables SI, Experts méthode qualité …
Pré-requis
Avoir des connaissances de base en systèmes d’information et sur les enjeux du traitement des données de masse.
Objectifs pédagogiques
Comprendre le rôle stratégique de la valeur des données pour l'entreprise
Identifier l’environnement réglementaire des données
Appréhender les principes et l’organisation de la gouvernance des données
Comprendre les outils et méthodologies utilisés dans la gestion de la qualité des données
Mettre en place une démarche de mesure de la qualité des données
Programme détaillé
Jour 1
Qualité de l’information dans les organisations
Définir les concepts clé : données, information, connaissance
Déterminer le cycle de vie de l’information
Identifier la valeur de la donnée
Caractéristiques de la qualité des données ?
La fraîcheur
La disponibilité
La cohérence
La traçabilité
La sécurisation
L’exhaustivité
Atelier
Étude de la qualité d’un jeu de données selon une grille proposée aux participants.
L’importance de la qualité de l’information
Le coût de la non-qualité
Qualité de l’information en interne
La qualité des relations entre l’entreprise et l’extérieur (clients, partenaires…)
Atelier
Analyses d’un jeu de données et conclusion sur la qualité
La perception des éditeurs dans la qualité des données
La démarche qualité
Identifier les motivations
Définir les événements déclencheurs des démarches QoD
La recherche de plus d’efficacité métier
Atelier
Suite de l’atelier précédent avec propositions d’action qualité
Enjeux réglementaires et juridiques
Identifier l’impact juridique et règlementaire en termes de qualité des données
Définir les obligations qui pourraient aller à l’encontre des démarches de qualité des données des entreprises
Atelier
Exemples de retours d’audit
Les facteurs clés de succès et bonnes pratiques
Lister les piliers de la qualité des données
Les bonnes questions à se poser
Le pilotage du projet
La gestion des volumes
Vers une gouvernance de l’information
Quiz de validation des acquis de la journée
Jour 2
Gouvernance des données
D’une démarche qualité à la mise en place d’une gouvernance de l’information
Répartition des rôles entre l’Informatique et les Métiers
Les 5 niveaux de maturité
Les principaux drivers pour la gouvernance des données
Organiser les éléments stratégiques des ensembles de données à l’aide des métadonnées
Favoriser la prise de responsabilité grâce aux workflows de stewardship des données
Créer un data lake avec une qualité de données native pour traiter le droit au consentement et les droits de la personne concernée
Suivre et gérer les données via des pistes d’audit et le lignage de données
Atelier
Zones de mise en valeur
Le coût de la faible qualité des données
Data Governance Committee et Staff
Les 5 niveaux de maturité
Les principaux drivers pour la gouvernance des données
Quiz de validation des acquis de la journée
Mesurer la qualité des données
La problématique des silos de données
Rôle du Master Data Management (MDM)
Les apports d’un outil de type DQM (Data Quality Management)
Les critères à prendre en compte pour évaluer un outil DQM (définition et contrôle de patterns, algorithmes spécifiques disponibles, simulation de fusion, profilage, convivialité pour la vue d’ensemble des données, etc.)
Quelques exemples d’outils
La place des ETL dans la qualité des données
Liens entre MDM et qualité (conformité)
Grille de « mesure » (complétude, exactitude, cohérence, pertinence)
Les procédures à appliquer et leurs coûts (humain, automatisation, etc.)
Mettre en place une démarche de mesure de la qualité des données
Atelier
Présentation d’un outil de type DQM
Limites, pièges à éviter et Perspectives
Les réticences aux démarches de qualité de l’information
Le coût de la sur-qualité
Explosion de la volumétrie
Changement de nature de la donnée
Impact du Web et des médias sociaux
Prise en considération accrue de la donnée non structurée