Aller au contenu principal

PLB CONSULTANT : 06. NoSQL - Apache Cassandra, mise en œuvre et administration

Organisme

PLB CONSULTANT
3-5 RUE MAURICE RAVEL
92300 LEVALLOIS PERRET
Voir toutes ses formationsAutres organismes proposant cette formation

Durée

21 heures

Modalités

Formation
  • Classe virtuelle
  • Présentiel
Évaluation

Travaux pratiques. QCM en cours et en fin de formation. Auto-évaluation en début et en fin de formation.

Prix

Inter
La formation en Inter est dispensée pour un groupe de salariés d’entreprises différentes.
882€ HT / personne
Intra
La formation en Intra est dispensée pour un groupe de salariés d’une seule et même entreprise.
3528€ HT / groupe
4 stagiaires minimum

Public

Chefs de projet, Administrateurs de bases de données, Développeurs, Architectes…

Pré-requis

Avoir des connaissances de base de l'administration de Linux ou Windows et d'une base de données relationnelle

Objectifs pédagogiques

Découvrir l'architecture de NoSQL Apache Cassandra et ses apports par rapport aux autres solutions 

Installer et configurer le SGBD NoSQL Apache Cassandra 

Administrer et sécuriser un cluster Cassandra

Appréhender le CQL (Cassandra Query Language)

Créer une base de données et manipuler ses objets

Connaitre la notion de grappe au sein de la base de données

Programme détaillé

Jour 1

Cassandra : fonctionnalités principales

Présentation de l'historique et des fonctionnalités de Cassandra

Introduction à la licence

Étude du format des données et "key-value"

Traitement de volumes importants et haute disponibilité

Présentation d'un système réparti de base de données

Installation et configuration de Cassandra

Rappel sur les prérequis

Présentation des plateformes supportées

Étude du fichier de configuration: conf/cassandra.yaml

Répertoire de travail, de stockage des données, gestion de la mémoire

Démarrage d'un noeud et test de l'interface cliente cqlsh

Travaux Pratiques

Installation d’un noeud Cassandra, connexion et validation de l’installation.

 

Quiz de validation des acquis de la première journée

 

Jour 2

Le CQL (Cassandra Query Language)

Maîtriser les commandes de base: connexion au système de base de données, création de colonnes, insertion, modification recherche, manipulation des objets

Le CQL: Cassandra Query Language

Exécution de scripts

Comment écrire des requêtes?

Étude des différentes approches

Travaux Pratiques

Création d’une base et de collections Cassandra, Import de contenu au format CSV dans une collection, manipulation des données en gros volumes.

Création de cluster Cassandra

Initiation au principe de base

Préparation du premier noeud : adresse d'écoute

Configuration de nouveaux noeuds

Notion de bootstrapping et de token

Paramètres listen_address et rpc_address

Réplication : topologie du réseau et EndpointSnitch

Stratégie de réplication

Ajout de noeuds, suppression

Cassandra dans un cloud

Travaux Pratiques

Création d’un cluster Cassandra, gestion des partitions et des réplicas, gestion de la topologie géographique et des stratégies de réplication, validation de la haute disponibilité.

Supervision

OpsCenter : installation, lancement

Utilisation de base

Supervision avec nodetool cfstats, ou export JMX vers des outils de supervision

Travaux Pratiques

Mettre en oeuvre un outil de supervision du cluster

 

Quiz de validation des acquis de la deuxième journée

 

Jour 3

Exploitation de Cassandra

Maîtriser les notions de sauvegarde : snapshot, incrémentielle

Import/export au format JSON

Travaux Pratiques

Sauvegarder et restaurer un keyspace et une table, mettre en oeuvre et valider des backups incrémentiels

Support MapReduce

Présentation du principe de MapReduce

Présentation de Hadoop et son écosystème, dont HBase, Spark

Import/Export de données Cassandra-Hadoop

Présentation du MapReduce sous Hadoop avec le InputFormat Cassandra

Support Spark

Description rapide de l'architecture spark

Mise en oeuvre depuis Cassandra

Exécution de travaux Spark s'appuyant sur un cluster Cassandra

Travaux Pratiques

Exécuter une fonction de recherche en scala sur Cassandra

 

Quiz final de validation des acquis de la formation

Sessions

Filtrer les résultats
Modalités pédagogiques
Formation synchrone se déroulant avec la présence physique du (des) formateur(s) et du (des) apprenant(s) réunis dans un même lieu de formation.
Formation combinant des séquences en présentiel et des séquences à distance synchrones ou asynchrones.
Formation à distance, asynchrone, s’appuyant sur une plateforme d’apprentissage, pouvant être complétée par d’autres modalités de formation à distance (visio-conférence…)
Formation à distance, synchrone, s’appuyant sur un dispositif de visio-conférence. La classe virtuelle recrée à distance les conditions d’une formation en salle traditionnelle.
Type de formation
La formation en Inter est dispensée pour un groupe de salariés d’entreprises différentes.
La formation en Intra est dispensée pour un groupe de salariés d’une seule et même entreprise.
Options
Les compétences professionnelles visées par la formation sont validées via un test permettant d’obtenir une certification officielle.
Ces sessions ne peuvent être ni annulées ni reportées par l’organisme de formation.