Aller au contenu principal

PLB CONSULTANT : 20. Machine learning, l'état de l'art

Organisme

PLB CONSULTANT
3-5 RUE MAURICE RAVEL
92300 LEVALLOIS PERRET
Voir toutes ses formationsAutres organismes proposant cette formation

Durée

14 heures

Modalités

Formation
  • Classe virtuelle
  • Présentiel
Évaluation

Études de cas. Travaux pratiques. Démonstrations. QCM en cours et en fin de formation. Auto-évaluation en début et en fin de formation.

Prix

Inter
La formation en Inter est dispensée pour un groupe de salariés d’entreprises différentes.
661.5€ HT / personne
Intra
La formation en Intra est dispensée pour un groupe de salariés d’une seule et même entreprise.
2646€ HT / groupe
4 stagiaires minimum

Public

Toute personne souhaitant comprendre les mécanismes et les bénéfices du Machine Learning : dirigeants d'entreprise, DSI, responsables informatiques, consultants, responsables de projets Big Data…

Pré-requis

Avoir une culture informatique générale. Posséder des notions de probabilités et statistiques est recommandé.  

Objectifs pédagogiques

Comprendre les concepts d’apprentissage automatique et l’évolution du Big Data vers le Machine Learning

Appréhender les enjeux de l'utilisation du Machine Learning, incluant les bénéfices attendus et des exemples d’usage

Identifier le positionnement du Machine Learning dans la chaîne de traitement de la donnée 

Connaitre les outils et les acteurs leaders du marché 

Découvrir les principaux algorithmes et la démarche projet à appliquer selon les cas d'usages en entreprise

Identifier les clés de réussite d'un projet intégrant du Machine Learning

Programme détaillé

Jour 1

Introduction au Machine Learning

Situer le Machine Learning dans l’évolution et l’histoire du Big Data

Définir les concepts d'Intelligence Artificielle et d’apprentissage automatique (Machine Learning)

Comprendre les différences entre l’analyse descriptive, l'analyse prédictive puis prescriptive

Exemples d’application du Machine learning pour divers directions ou métier : marketing, vente, logistique, RH, santé, transport, la sécurité, l’énergie, la distribution, le luxe, le tourisme...

Déterminer les résultats et bénéfices attendus du Machine Learning

Démonstration

Détection de transaction frauduleuse, prédiction des ventes dans l’immobiliers, consommation électrique en ville

Machine Learning, outils et acteurs du marché

Identifier les bibliothèques les plus utilisées (TensorFlow, Keras, Pytorch, Scikit learn)

Choisir entre les deux leaders Open Source : Python et R

Plateformes Cloud (Azure, AWS, Google Cloud Platform) et solutions SaaS (IBM Watson, Dataïku)

Connaitre les API en ligne (IBM Watson, Microsoft Cortana Intelligence, IA AWS ..) et les chatbots

Démonstration

Création d’un agent conversationnel (Chatbots), Système de recommandation

La donnée et les apprentissages en Machine Learning

Identifier les données structurées, semi-structurées et non structurées

Choisir la nature statistique des données (qualitatives ou quantitatives)

Définir la typologie des algorithmes

- Apprentissage supervisé : répéter un exemple

- Apprentissage non supervisé : découvrir les données

- Reinforcement Learning : optimisation d'une récompense

- Les autres types d'apprentissage (par transfert, séquentiel, actif...)

Faire le lien entre les mathématiques, le Big Data, l’IA et le machine Learning

Étude de cas

Comprendre et reconnaitre les différentes typologies d’algorithmes (différences supervisé non supervisé).

Nous présentons des contextes de données différents (format, volume, etc.) et des « attentes projets ». Vous devez classer les différents cas présentés par type d’algorithme à mettre en oeuvre pour atteindre les objectifs du projet présenté.

Les principaux algorithmes du Machine Learning

Utiliser la régression linéaire simple et multiple

Tester la régression polynomiale

Définir les séries temporelles

Comprendre la régression logistique et applications en scoring

Identifier la classification hiérarchique et non hiérarchique (KMeans)

Définir une classification par arbres de décision ou approche Naïve Bayes

Utiliser le Ramdom Forest (développement des arbres de décision)

Gradiant Boosting

Réseaux de neurones

Machine à support de vecteurs

Étude de cas

Démonstration réseau de neurones reconnaissance de caractères manuscrits (MNIST)

 

Quiz de validation des acquis de la journée

 

Jour 2

Démarche Machine Learning dans le traitement de la donnée

Prévoir la collecte et la préparation des données

Identification des corrélations

Réduire la complexité d’un problème pour le résoudre par analyse des composantes principales

Comment réduire la dimension et sélectionner les variables pertinentes ?

Détection et correction des valeurs aberrantes

Data augmentation : création de nouvelles variables pour aider à résoudre le problème

Exercice

Préparation d’un jeu de données - Nettoyage des données et valeurs manquantes

Mise en pratique : Procédure d'entraînement et d'évaluation des algorithmes

Séparation du jeu de données en plusieurs : entraînement, test et validation

Techniques de bootstrap (bagging)

Exemple de la validation croisée

Définition d'une métrique de performance

Descente de gradient stochastique (minimisation de la métrique)

Courbes ROC et de lift pour évaluer et comparer les algorithmes

Matrice de confusion : faux positifs et faux négatifs

Étude de cas

Comprendre les différentes mesures de performance d’un algorithme et leurs utilisations à travers des exemples fournis dans votre espace de travail

Envisager la mise en production d'un algorithme de Machine Learning

Description d'une plateforme Big Data

Principe de fonctionnement des API

Du développement à la mise en production

Stratégie de maintenance corrective et évolutive

Évaluation du coût de fonctionnement en production

Étude de cas

Mise en place d’un projet simple de Machine Learning en python à l’aide d’API (concrètement on utilise des algorithmes « tout faits » qu’il reste juste à paramétrer).

Mise en oeuvre et gestion de projet impliquant du Machine Learning

Les spécificités d’un projet Machine Learning, son cycle de vie

Identifier les différents acteur d’un projet et post-projet

Définir les nouveaux rôles dans l'entreprise : chief data officer, data protection officer, data engineer, data scientist, data analyst, data miner...

Déterminer les prestataires externes et l’écosystème interne à l’entreprise

Préparer sa roadmap de la mise en oeuvre du Machine Learning (avant, pendant et après le projet)

Mise en place d’un Proof Of Concept

Prévoir rétro planning, CheckList et bonnes pratiques d’un projet Machine Learning

Protection et droit d’accès aux données personnelles

L’accompagnement aux changements nécessaire (formation, communication, management)

Réflexion : Échanges selon les spécificités métiers et activité de chacun

 

Quiz de validation final des acquis de la formation

Sessions

Filtrer les résultats
Modalités pédagogiques
Formation synchrone se déroulant avec la présence physique du (des) formateur(s) et du (des) apprenant(s) réunis dans un même lieu de formation.
Formation combinant des séquences en présentiel et des séquences à distance synchrones ou asynchrones.
Formation à distance, asynchrone, s’appuyant sur une plateforme d’apprentissage, pouvant être complétée par d’autres modalités de formation à distance (visio-conférence…)
Formation à distance, synchrone, s’appuyant sur un dispositif de visio-conférence. La classe virtuelle recrée à distance les conditions d’une formation en salle traditionnelle.
Type de formation
La formation en Inter est dispensée pour un groupe de salariés d’entreprises différentes.
La formation en Intra est dispensée pour un groupe de salariés d’une seule et même entreprise.
Options
Les compétences professionnelles visées par la formation sont validées via un test permettant d’obtenir une certification officielle.
Ces sessions ne peuvent être ni annulées ni reportées par l’organisme de formation.