Aller au contenu principal
Afficher le fil d'ariane

SOFTEAM : 05. ElasticSearch : indexation de contenu

Durée

14 heures

Modalités

Formation

  • Classe virtuelle
  • Présentiel

Évaluation

Tout au long et/ou à l’issue de la formation : évaluation des acquis des stagiaires via des exercices, des QCM, des QUIZZ, des mises en situation et/ou des cas pratiques.

Prix

Inter
La formation en Inter est dispensée pour un groupe de salariés d’entreprises différentes.
658€ HT / personne
Intra
La formation en Intra est dispensée pour un groupe de salariés d’une seule et même entreprise.
2700€ HT / groupe
4 stagiaires minimum

Public

Administrateur système, Architectes, Développeurs, Data Analysts et/ou Data Engineers…

Pré-requis

Disposer de solides bases en administration système Unix/Linux

Objectifs pédagogiques

Situer Elasticsearch dans un écosystème Big Data

Identifier les enjeux et les cas d'utilisation d'un moteur de recherche

Appréhender le fonctionnement d'ElasticSearch

Savoir installer et configurer ElasticSearch 

Indexer des volumes importants de données 

Comprendre comment administrer le système et le surveiller afin de garantir sa disponibilité

Programme détaillé

Concepts de base

  • Concept du moteur de recherche
  • Introduction à Elasticsearch
  • Concepts basics d'Elasticsearch
  • Installation et configuration

 

Indexation de documents   

  • Vue générale de l'API REST
  • CRUD API : Index, Get, Exist, Delete, Update, Multi Get, Bulk
  • Le versionage des documents

 

Elasticsearch vs Lucene : les valeurs ajoutées

  • Index inversé
  • Trace de transaction
  • Segment

 

Analyse de texte

  • Le besoin d'une analyse de texte
  • Anatomie d'un Analyzer
  • Analyze API
  • Configuration d'un Analyzer
  • Les Tokenizers (Parseurs en Token)
  • Filtre de Tokens
  • Filtre de Synonyme
  • ICU Tokenizers & FiltersSQL avec Spark

 

Mapping

  • Les fondamentaux du Mapping
  • Mapping API
  • Les différents attributs et types de champs

 

Recherche de documents

  • Recherche de documents

 

Spark – SQL découverte

  • Les dataframes
  • Chargement de données avec un schéma
  • Agrégation
  • Jointure
  • SQL avec Spark

 

Spark – streaming, recherche avancée

  • Agrégation : Scope
  • Agrégation métrique
  • Agrégation bucket
  • Pertinence
  • Modèle d'espace vectoriel
  • TF/IDF
  • Booster la requête
  • Scoring personalisé
  • Highlighting
  • Suggestion
  • Relation des documents
  • Problématique
  • Dénormalisation
  • Nested Object :
  • Mapping
  • Requête, Filtre, Agrégations
  • Parent / Child :
  • Mapping
  • Requête, Filtre, Agrégations
  • Fonctionnalités avancées
  • Percolator
  • Geolocation

 

Vers la production

  • Configuration d'un cluster
  • Scalabilité et volumétrie de données
  • Bonnes pratiques matérielles
  • Supervision

 

Java et Elasticsearch

  • Requête DSL
  • Requête full-text
  • Requête aux termes
  • Requête composée
  • BitSet, Filtre et Lucene
  • Pagination
  • Ordonnancement
  • Types de recherche
  • Warmer Api

Sessions

Filtrer les résultats

63 résultats

Modalités pédagogiques
Formation synchrone se déroulant avec la présence physique du (des) formateur(s) et du (des) apprenant(s) réunis dans un même lieu de formation.
Formation combinant des séquences en présentiel et des séquences à distance synchrones ou asynchrones.
Formation à distance, asynchrone, s’appuyant sur une plateforme d’apprentissage, pouvant être complétée par d’autres modalités de formation à distance (visio-conférence…)
Formation à distance, synchrone, s’appuyant sur un dispositif de visio-conférence. La classe virtuelle recrée à distance les conditions d’une formation en salle traditionnelle.
Type de formation
La formation en Inter est dispensée pour un groupe de salariés d’entreprises différentes.
La formation en Intra est dispensée pour un groupe de salariés d’une seule et même entreprise.
Options
Ces sessions ne peuvent être ni annulées ni reportées par l’organisme de formation.

0 résultat