PLB CONSULTANT : 06. NoSQL - Apache Cassandra, mise en œuvre et administration
Organisme
92300 LEVALLOIS PERRETVoir toutes ses formationsAutres organismes proposant cette formation
Durée
Modalités
- Classe virtuelle
- Présentiel
Travaux pratiques. QCM en cours et en fin de formation. Auto-évaluation en début et en fin de formation.
Prix
Public
Chefs de projet, Administrateurs de bases de données, Développeurs, Architectes…
Pré-requis
Avoir des connaissances de base de l'administration de Linux ou Windows et d'une base de données relationnelle
Objectifs pédagogiques
Découvrir l'architecture de NoSQL Apache Cassandra et ses apports par rapport aux autres solutions
Installer et configurer le SGBD NoSQL Apache Cassandra
Administrer et sécuriser un cluster Cassandra
Appréhender le CQL (Cassandra Query Language)
Créer une base de données et manipuler ses objets
Connaitre la notion de grappe au sein de la base de données
Programme détaillé
Jour 1
Cassandra : fonctionnalités principales
Présentation de l'historique et des fonctionnalités de Cassandra
Introduction à la licence
Étude du format des données et "key-value"
Traitement de volumes importants et haute disponibilité
Présentation d'un système réparti de base de données
Installation et configuration de Cassandra
Rappel sur les prérequis
Présentation des plateformes supportées
Étude du fichier de configuration: conf/cassandra.yaml
Répertoire de travail, de stockage des données, gestion de la mémoire
Démarrage d'un noeud et test de l'interface cliente cqlsh
Travaux Pratiques
Installation d’un noeud Cassandra, connexion et validation de l’installation.
Quiz de validation des acquis de la première journée
Jour 2
Le CQL (Cassandra Query Language)
Maîtriser les commandes de base: connexion au système de base de données, création de colonnes, insertion, modification recherche, manipulation des objets
Le CQL: Cassandra Query Language
Exécution de scripts
Comment écrire des requêtes?
Étude des différentes approches
Travaux Pratiques
Création d’une base et de collections Cassandra, Import de contenu au format CSV dans une collection, manipulation des données en gros volumes.
Création de cluster Cassandra
Initiation au principe de base
Préparation du premier noeud : adresse d'écoute
Configuration de nouveaux noeuds
Notion de bootstrapping et de token
Paramètres listen_address et rpc_address
Réplication : topologie du réseau et EndpointSnitch
Stratégie de réplication
Ajout de noeuds, suppression
Cassandra dans un cloud
Travaux Pratiques
Création d’un cluster Cassandra, gestion des partitions et des réplicas, gestion de la topologie géographique et des stratégies de réplication, validation de la haute disponibilité.
Supervision
OpsCenter : installation, lancement
Utilisation de base
Supervision avec nodetool cfstats, ou export JMX vers des outils de supervision
Travaux Pratiques
Mettre en oeuvre un outil de supervision du cluster
Quiz de validation des acquis de la deuxième journée
Jour 3
Exploitation de Cassandra
Maîtriser les notions de sauvegarde : snapshot, incrémentielle
Import/export au format JSON
Travaux Pratiques
Sauvegarder et restaurer un keyspace et une table, mettre en oeuvre et valider des backups incrémentiels
Support MapReduce
Présentation du principe de MapReduce
Présentation de Hadoop et son écosystème, dont HBase, Spark
Import/Export de données Cassandra-Hadoop
Présentation du MapReduce sous Hadoop avec le InputFormat Cassandra
Support Spark
Description rapide de l'architecture spark
Mise en oeuvre depuis Cassandra
Exécution de travaux Spark s'appuyant sur un cluster Cassandra
Travaux Pratiques
Exécuter une fonction de recherche en scala sur Cassandra