Aller au contenu principal

AMBIENT IT : 07. Talend : intégration de données pour le Big Data

Durée

21 heures

Modalités

Formation
  • Classe virtuelle
  • Présentiel
Évaluation

Travaux pratiques, QCM de validation des acquis, évaluation à chaud et à froid.

Prix

Inter
La formation en Inter est dispensée pour un groupe de salariés d’entreprises différentes.
882€ HT / personne
Intra
La formation en Intra est dispensée pour un groupe de salariés d’une seule et même entreprise.
3528€ HT / groupe
4 stagiaires minimum

Public

Consultants BI, Architectes, Chefs de projets, Gestionnaires de données ou toute personnes devant gérer des flux de données. 

Pré-requis

Avoir des connaissances en Hadoop, Spark et Kafka

Objectifs pédagogiques

Maîtriser Talend dans un environnement Big Data

Se servir de Talend comme lien entre les fichiers, applications et bases de données

Acquérir la philosophie de l'outil

Adopter des bonnes pratiques et concevoir des Systèmes d’informations flexibles et bustes

Être capable d'implémenter ses Jobs

Lire et écrire des données sur HDFS et dans des bases de données NoSQL avec des Jobs Talend

Réaliser des Jobs de transformation à l'aide de Pig et Hive

Gérer la qualité de la donnée avec Talend

Utiliser Scoop pour faciliter la migration de bases de données relationnelles dans Hadoop

Maîtriser l'utilisation de la bibliothèque de composants

Effectuer des traitements ETL (Extraction, Transform and Load) simple et complexes de bout en bout

Programme détaillé

INTRODUCTION

  • Installation
  • Contexte et métadonnées

 

CARTOGRAPHIE DES DONNÉES

  • Données cartographiques
  • Génération de données
  • Sortie des rejets de tMap
  • Filtrage des données cartographiées
  • Données de la BDD cartographique

 

CONVERSION, EXTRACTION, ADHÉSION

  • Expressions Regex
  • Conversion de XML vers CSV
  • Conversion de CSV vers XML
  • XML avancé
  • Donnéesd’adhésion
  • Fractionnement des données
  • Unification des données

 

FONCTIONNALITÉS UTILES

  • Retirer et ajouter des propriétés
  • Nombre de lignes
  • Temp, supprimer, déplacer, renommer

 

JAVA

  • Les bases de tJava
  • Composant tJavaRow
  • Volet tJavaFlex
  • Utilisations personnalisées

 

BASE DE DONNÉES

  • Utilisation d’Hyper SQL
  • Analyse des schémas des tableaux
  • Importation des schémas
  • Lecture et écriture des données dans une BDD

 

DÉBOGAGE, EXPLOITATION, CONSTRUCTION, PROGRAMMATION

  • Débogage
  • Traitement des rejets
  • Utilisation de tMsgbox
  • Traitement des rejets d’entrée avec tMap
  • Créer des emplois pour Talend
  • Ajouter un contexte en ligne de commande
  • Planification des tâches

 

CONCEPTS AVANCE

  • Sous emplois
  • Composants sur mesure
  • tFileExcel (composants personnalisés)
  • tSystem
  • tSCP

Sessions

Filtrer les résultats
Modalités pédagogiques
Formation synchrone se déroulant avec la présence physique du (des) formateur(s) et du (des) apprenant(s) réunis dans un même lieu de formation.
Formation combinant des séquences en présentiel et des séquences à distance synchrones ou asynchrones.
Formation à distance, asynchrone, s’appuyant sur une plateforme d’apprentissage, pouvant être complétée par d’autres modalités de formation à distance (visio-conférence…)
Formation à distance, synchrone, s’appuyant sur un dispositif de visio-conférence. La classe virtuelle recrée à distance les conditions d’une formation en salle traditionnelle.
Type de formation
La formation en Inter est dispensée pour un groupe de salariés d’entreprises différentes.
La formation en Intra est dispensée pour un groupe de salariés d’une seule et même entreprise.
Options
Les compétences professionnelles visées par la formation sont validées via un test permettant d’obtenir une certification officielle.
Ces sessions ne peuvent être ni annulées ni reportées par l’organisme de formation.