Aller au contenu principal

ORSYS : 03. Les Architectures et infrastructures pour le Big Data

Durée

21 heures

Modalités

Formation
  • Classe virtuelle
  • Présentiel
Évaluation

Mettre en place une plateforme Hadoop et ses composants de base, utiliser un ETL pour gérer les données, créer des modèles d'analyse et dashboards.

Prix

Inter
La formation en Inter est dispensée pour un groupe de salariés d’entreprises différentes.
1102.5€ HT / personne
Intra
La formation en Intra est dispensée pour un groupe de salariés d’une seule et même entreprise.
4961.25€ HT / groupe
4 stagiaires minimum

Public

Chefs de projets, Architectes, Développeurs, Data Scientists ou toute personne souhaitant connaître les outils pour concevoir une architecture Big Data…

Pré-requis

Avoir une bonne culture générale des systèmes d'information et plus particulièrement, avoir des connaissances de base des modèles relationnels, des statistiques et des langages de programmation.

Objectifs pédagogiques

Comprendre les principaux concepts du Big Data ainsi que l'écosystème technologique d'un projet Big Data

Savoir analyser les difficultés propres à un projet Big Data

Déterminer la nature des données manipulées

Appréhender les éléments de sécurité, d'éthique et les enjeux juridiques

Exploiter les architectures Big Data

Mettre en place des socles techniques complets pour des projets Big Data

Programme détaillé

Big Data, méthodes et solutions pratiques pour l'analyse des données

Ce cours vous permettra de comprendre les enjeux et les apports du Big Data ainsi que les technologies pour le mettre en œuvre. Vous apprendrez à intégrer des volumétries massives de données structurées et non structurées via un ETL, puis à les analyser grâce à des modèles statistiques et des dashboards dynamiques.

 

Objectifs pédagogiques

  1.  Comprendre les principaux concepts du Big Data ainsi que l'écosystème technologique d'un projet Big Data
  2.  Savoir analyser les difficultés propres à un projet Big Data
  3.  Déterminer la nature des données manipulées
  4.  Appréhender les éléments de sécurité, d'éthique et les enjeux juridiques
  5. Exploiter les architectures Big Data
  6. Mettre en place des socles techniques complets pour des projets Big Data

 

Déroulement de la formation :

  1. Comprendre les concepts et les enjeux du Big Data
  2. Les technologies du Big Data
  3. Gérer les données structurées et non structurées

 

Programme détaillé de la formation :

1. Comprendre les concepts et les enjeux du Big Data

1   jour

- Origines et définition du Big Data.

- Les chiffres clés du marché dans le monde et en France.

- Les enjeux du Big Data : ROI, organisation, confidentialité des données.

- Un exemple d'architecture Big Data.

-  Aspect éthique et juridique de la gestion des données.

-  La sécurité des données.  

 

 2. Les technologies du Big Data

1   jour

- Description de l'architecture et des composants de la plateforme Hadoop.

- Les modes de stockage (NoSQL, HDFS).

- Principes de fonctionnement de MapReduce, Spark, Storm...

- Principales distributions du marché (Hortonworks, Cloudera, MapR, Elastic Map Reduce, Biginsights).

- Installer une plateforme Hadoop.

- Les technologies du datascientist.

- Présentation des technologies spécifiques pour le Big Data (Tableau, Talend, Qlikview ...).

Exercice

Installation d'une plateforme Big Data Hadoop (via Cloudera QuickStart ou autre).

 

 3. Gérer les données structurées et non structurées

1   jour

- Principes de fonctionnement de Hadoop Distributed File System (HDFS).

- Importer des données externes vers HDFS.

- Réaliser des requêtes SQL avec HIVE.

- Utiliser PIG pour traiter la donnée.

- Le principe des ETL (Talend...).

- Gestion de streaming de données massive (NIFI, Kafka, Spark, Storm...)

Exercice

Implémentation de flux de données massives.

Sessions

Filtrer les résultats
Modalités pédagogiques
Formation synchrone se déroulant avec la présence physique du (des) formateur(s) et du (des) apprenant(s) réunis dans un même lieu de formation.
Formation combinant des séquences en présentiel et des séquences à distance synchrones ou asynchrones.
Formation à distance, asynchrone, s’appuyant sur une plateforme d’apprentissage, pouvant être complétée par d’autres modalités de formation à distance (visio-conférence…)
Formation à distance, synchrone, s’appuyant sur un dispositif de visio-conférence. La classe virtuelle recrée à distance les conditions d’une formation en salle traditionnelle.
Type de formation
La formation en Inter est dispensée pour un groupe de salariés d’entreprises différentes.
La formation en Intra est dispensée pour un groupe de salariés d’une seule et même entreprise.
Options
Les compétences professionnelles visées par la formation sont validées via un test permettant d’obtenir une certification officielle.
Ces sessions ne peuvent être ni annulées ni reportées par l’organisme de formation.