PLB CONSULTANT : 04. Les fondamentaux du NoSQL
Organisme
92300 LEVALLOIS PERRETVoir toutes ses formationsAutres organismes proposant cette formation
Durée
Modalités
- Classe virtuelle
- Présentiel
Travaux pratiques. QCM en cours et en fin de formation. Auto-évaluation en début et en fin de formation.
Prix
Public
Responsables informatique, Chefs de projet, Architectes, Développeurs, décideurs....
Pré-requis
Avoir des connaissances de base des architectures techniques, du management SI et des bases de données
Objectifs pédagogiques
Identifier les différences entre SGBD SQL et SGBD NoSQL
Évaluer les apports et les inconvénients inhérents aux technologies NoSQL
Identifier les principaux acteurs et solutions du marché pour chaque modèle de données
Connaître les champs d'application des SGBD NoSQL en opérationnel et en analytique
Comprendre les différentes architectures, modèles de données et implémentations techniques
Identifier les critères de choix
Programme détaillé
Jour 1
Des SGBD relationnels au NoSQL
Rappels synthétiques sur la philosophique des SGBDR
Qu’entend-on par données structurées et données non-structurées ?
Exemples de « nouvelles » sources de données (logs, IoT, sites Web, etc.)
Évolutions technologiques et avènement du NoSQL
Champs d’application des bases NoSQL et des SGBDR
Avantages et Inconvénients par rapports aux bases « classiques »
Ateliers
Analyse de différents formats de données pour comprendre qu’un SGBDR traditionnel n’est pas adapté au stockage ni au traitement de certains formats de données (indépendamment du volume)
Différentes familles NoSQL
Principaux acteurs et solutions du marché
Les bases de données clé/valeur
Comment gérer l’intégrité des données ?
Les bases de données orientées document
Exemples de traitements sur des formats JSON ou XML
Comment stocker des documents binaires ?
Les bases orientées colonne distribuées pour le Big Data opérationnel : Hadoop, HBase, Cassandra…
L'écosystème Hadoop (différences avec les SGBDR, liens avec le NoSQL)
Ateliers
Manipulation des données dans un contexte Big Data avec l’outil HBase de Hadoop
Observation du format des données manipulées sur des bases en production (Cassandra, Redis, MongoDB)
Quiz de validation des acquis de la première journée
Comment choisir une base NoSQL ?
Synthèse des principaux acteurs Open Source (MongoDB, Cassandra, Redis, CouchBase…)
Les choix matériels
Comment aborder la migration ?
Les impacts sur le développement client. Comment développer efficacement avec des bases NoSQL ?
Quels outils de supervision et comment les choisir ?
Quelle est la complexité administrative et la courbe d'apprentissage ?
Cas d'utilisation dans des entreprises existantes
Et les performances ? Quelques benchmarks ?
Qu'est-ce que NewSQL ?
Ateliers
Création interactive d’une matrice de synthèse comparant les différents acteurs, leur contexte propice d’utilisation, leurs points forts et leurs faiblesses en fonction de différents paramètres comme les fonctionnalités, la recherche, le stockage, la souplesse dans la scalabilité, les performances, la courbe d’apprentissage, etc.
Jour 2
NoSQL et Big Data
Liens entre NoSQL et Big Data
L’offre Hadoop pour le stockage et l’analyse de données
Problématique de la répartition des donnés d’une base NoSQL
Exemples de données stockées sur un système de type HDFS
Les différents traitements sur les données (streaming, mapreduce, graphe, machine learning…)
La recherche d’information dans un gros volume (moteur de recherche, pagerank, etc.)
Traiter les données avec Spark
Les outils permettant de se relier à d’autres moteurs (ETL, Apache Sqoop...)
Les offres NoSQL pour le Big Data dans le Cloud (Amazon, Google, Azure, OVH)
Démonstration
Visite guidée de l’offre NoSQL dans le Cloud d’un acteur majeur du marché
Nettoyage d’un gros volume de données non structuré selon un motif imposé (format de numéro de téléphone)
Traitement d’un gros volume de données avec Spark au-dessus d’une base NoSQL
Dialogue avec une base NoSQL (MongoDB)
Comprendre le fonctionnement du moteur de stockage des données
Création de documents et manipulations (shell)
Importation de données des SGBDR au format JSON
Indexer les données
Suivre les données et les index dans le temps
Répliquer les données
Partitionner les données
En quoi consiste l’administration d’une base NoSQL au quotidien ?
Ateliers guidés par le formateur
Premiers pas avec le shell de MongoDB
Création de bases et de collections
Intégration de données au format JSON (messages d’applications diverses que l’on stocke)
Requêtage sur ces données
Mise en place d’index et observation du déroulement des requêtes