Aller au contenu principal

ORSYS : 02. Etat de l'art du Big Data

Durée

14 heures

Modalités

Formation
  • Classe virtuelle
  • Présentiel
Évaluation

Le formateur évalue la progression pédagogique du participant tout au long de la formation au moyen de QCM, mises en situation, travaux pratiques…

Prix

Inter
La formation en Inter est dispensée pour un groupe de salariés d’entreprises différentes.
808.5€ HT / personne
Intra
La formation en Intra est dispensée pour un groupe de salariés d’une seule et même entreprise.
3412.5€ HT / groupe
4 stagiaires minimum

Public

Directeurs SI, Responsables SI, Chefs de projets, Architectes, Consultants ou toute personne amenée à participer à un projet Big Data …

Pré-requis

Avoir des connaissances de base des architectures techniques et du fonctionnement d’un système de gestion de base de données (SGBD).

Objectifs pédagogiques

Découvrir les principaux concepts du Big Data

Appréhender les avantages et les contraintes du Big Data

Comprendre les enjeux économiques du Big Data

Connaître l’écosystème du Big Data et appréhender les technologies associées

Savoir anticiper son intégration dans les activités informatiques de l’entreprise

Prendre en compte la sécurité et la confidentialité des données dans l’exploitation du Big Data

Programme détaillé

Big Data, état de l'art

L'accroissement continuel des données numériques dans les organisations a conduit à l'émergence du Big Data. Ce concept recouvre les questions de stockage et de conservation de vastes quantités de données mais aussi celles liées au gisement potentiel de valeur que représentent ces masses d'informations. Ce séminaire présente les problèmes spécifiques du Big Data et les solutions techniques potentielles, de la gestion des données aux différents types de traitement.

 

Objectifs pédagogiques

  1. Découvrir les principaux concepts du Big Data
  2. Appréhender les avantages et les contraintes du Big Data
  3.  Comprendre les enjeux économiques du Big Data
  4.  Connaître l’écosystème du Big Data et appréhender les technologies associées
  5. Savoir anticiper son intégration dans les activités informatiques de l’entreprise
  6. Prendre en compte la sécurité et la confidentialité des données dans l’exploitation du Big Data

 

Déroulement de la formation :

  1. Introduction
  2. Big Data : traitement depuis l'acquisition jusqu'au résultat
  3. Relations entre Cloud et Big Data
  4. Introduction à l'Open Data
  5. Matériel pour les architectures de stockage
  6. Protection des données
  7. Méthodes de traitement et champs d'application

 

Programme détaillé de la formation :

 

 1. Introduction

1/4 jour

- Les origines du Big Data : un monde de données numériques, l'e-santé, chronologie.

- Une définition par les quatre V : la provenance des données.

- Une rupture : changements de quantité, de qualité, d'habitudes.

- La valeur de la donnée : un changement d'importance.

- La donnée en tant que matière première.

- Le quatrième paradigme de la découverte scientifique.  

 

 2. Big Data : traitements depuis l'acquisition jusqu'au résultat

1/4 jour

- L'enchaînement des opérations. L'acquisition.

- Le recueil des données : crawling, scraping.

- La gestion de flux événementiels (Complex Event Processing, CEP).

- L'indexation du flux entrant.

- L'intégration avec les anciennes données.

- La qualité des données : un cinquième V ?

- Les différents types de traitement : recherche, apprentissage (Machine Learning, transactionnel, data mining).

- D'autres modèles d'enchaînement : Amazon, e-Santé.

- Un ou plusieurs gisements de données ? De Hadoop à l'in-memory.

- De l'analyse de tonalité à la découverte de connaissances.  

 

 3. Relations entre Cloud et Big Data

1/4 jour

- Le modèle d'architecture des Clouds publics et privés.

- Les services XaaS.

- Les objectifs et avantages des architectures Cloud.

- Les infrastructures.

- Les égalités et les différences entre Cloud et Big Data.

- Les Clouds de stockage.

- Classification, sécurité et confidentialité des données.

- La structure comme critère de classification : non structurée, structurée, semi-structurée.

- Classification selon le cycle de vie : données temporaires ou permanentes, archives actives.

- Difficultés en matière de sécurité : augmentation des volumétries, la distribution.

- Les solutions potentielles.  

 

 4. Introduction à l'Open Data

1/4 jour

- La philosophie des données ouvertes et les objectifs.

- La libération des données publiques.

- Les difficultés de la mise en œuvre.

- Les caractéristiques essentielles des données ouvertes.

- Les domaines d'application. Les bénéfices escomptés.

  

 5. Matériel pour les architectures de stockage

1/3 jour

- Les serveurs, disques, réseaux et l'usage des disques SSD, l'importance de l'infrastructure réseau.

- Les architectures Cloud et les architectures plus traditionnelles.

- Les avantages et les difficultés.

- Le TCO. La consommation électrique : serveurs (IPNM), disques (MAID).

- Le stockage objet : principe et avantages.

- Le stockage objet par rapport aux stockages traditionnels NAS et SAN.

- L'architecture logicielle.

- Niveaux d'implantation de la gestion du stockage.

- Le "Software Defined Storage".

- Architecture centralisée (Hadoop File System).

- L'architecture Peer-to-Peer et l'architecture mixte.

- Les interfaces et connecteurs : S3, CDMI, FUSE, etc.

- Avenir des autres stockages (NAS, SAN) par rapport au stockage objet.  

 

 6. Protection des données

1/3 jour

- La conservation dans le temps face aux accroissements de volumétrie.

- La sauvegarde, en ligne ou locale ?

- L'archive traditionnelle et l'archive active.

- Les liens avec la gestion de hiérarchie de stockage : avenir des bandes magnétiques.

- La réplication multisites.

- La dégradation des supports de stockage.  

 

 7. Méthodes de traitement et champs d'application

1/3 jour

- Classification des méthodes d'analyse selon le volume des données et la puissance des traitements.

- Hadoop : le modèle de traitement Map Reduce.

- L'écosystème Hadoop : Hive, Pig. Les difficultés d'Hadoop.  

 

Sessions

Filtrer les résultats

49 résultats

Modalités pédagogiques
Formation synchrone se déroulant avec la présence physique du (des) formateur(s) et du (des) apprenant(s) réunis dans un même lieu de formation.
Formation combinant des séquences en présentiel et des séquences à distance synchrones ou asynchrones.
Formation à distance, asynchrone, s’appuyant sur une plateforme d’apprentissage, pouvant être complétée par d’autres modalités de formation à distance (visio-conférence…)
Formation à distance, synchrone, s’appuyant sur un dispositif de visio-conférence. La classe virtuelle recrée à distance les conditions d’une formation en salle traditionnelle.
Type de formation
La formation en Inter est dispensée pour un groupe de salariés d’entreprises différentes.
La formation en Intra est dispensée pour un groupe de salariés d’une seule et même entreprise.
Options
Les compétences professionnelles visées par la formation sont validées via un test permettant d’obtenir une certification officielle.
Ces sessions ne peuvent être ni annulées ni reportées par l’organisme de formation.

0 résultat