AMBIENT IT : 03. Les Architectures et infrastructures pour le Big Data
Organisme
93500 PANTINVoir toutes ses formationsAutres organismes proposant cette formation
Durée
Modalités
- Classe virtuelle
- Présentiel
Travaux pratiques, QCM de validation des acquis, évaluation à chaud et à froid.
Prix
Public
Chefs de projets, Architectes, Développeurs, Data Scientists ou toute personne souhaitant connaître les outils pour concevoir une architecture Big Data…
Pré-requis
Avoir une bonne culture générale des systèmes d'information et plus particulièrement, avoir des connaissances de base des modèles relationnels, des statistiques et des langages de programmation.
Objectifs pédagogiques
Comprendre les principaux concepts du Big Data ainsi que l'écosystème technologique d'un projet Big Data
Savoir analyser les difficultés propres à un projet Big Data
Déterminer la nature des données manipulées
Appréhender les éléments de sécurité, d'éthique et les enjeux juridiques
Exploiter les architectures Big Data
Mettre en place des socles techniques complets pour des projets Big Data
Programme détaillé
INTRODUCTION AU BIG DATA
- Les principaux concepts du Big Data
- Des données à la création de valeur
- Apporter de la valeur complémentaire
- Écosystème de projet
- Les acteurs du Big Data et leurs positionnements
- Opportunités offertes par le Big Data
ARCHITECTURES BIG DATA
- Les modèles de calcul du Big Data
- Étapes de gestion des données
- Les systèmes de publication et d’abonnement
- Traitement en continu
- Niveau avancé de l’architecture
- Approches industrielles
- Architectures de Big Data basées sur les acteurs et les agents
LES SOLUTIONS BIG DATA
- Projet, applications et plateformes
- Stockage des données
- Considérations Hardware :
- CPU
- Réseau
- Mémoire
- Systèmes distribués
- Analyse prédictive
LES FONCTIONNALITÉS DU BIG DATA
- Systèmes de recommandation
- Recherche
- Algorithmes ad-tech et Real Time Bidding (RTB)
- Génération de graphes inter-appareils
- Systèmes de prévision et de prédiction
- Big Data des médias sociaux
- Détection des anomalies et des fraudes
- Contrôle et surveillance des réseaux électriques intelligents
LES ENJEUX JURIDIQUES
- Règles d’éthique et enjeux juridiques
- Sécurisation des données personnelles
- Interdiction à la collecte : information sensible
- Accords intrapays
ARCHITECTURES DISTRIBUÉES
- Difficultés et opportunités d’une architecture distribuée
- Architecture massivement parallèle
- Types de paradigmes de calculs distribués
- Traitement complexe de données
- Machine Learning
- Datamining
- NoSQL avec le calcul distribué
ARCHITECTURE TECHNIQUE ET APPLICATIVE
- Les différences principales
- Étapes de la gestion de données
- Les différents outils du marché
- Injection de données
- Stockage de données avec Hadoop, HDFS, NoSQL
- Restitution et visualisation
- Capture des données
- Diffusion des données
- Traitement en temps réel
- Supervision des plateformes (Ambari, App Dynamix)