AMBIENT IT : 20. Machine learning, l'état de l'art
Organisme
93500 PANTINVoir toutes ses formationsAutres organismes proposant cette formation
Durée
Modalités
- Classe virtuelle
- Présentiel
Travaux pratiques, QCM de validation des acquis, évaluation à chaud et à froid.
Prix
Public
Toute personne souhaitant comprendre les mécanismes et les bénéfices du Machine Learning : dirigeants d'entreprise, DSI, responsables informatiques, consultants, responsables de projets Big Data…
Pré-requis
Avoir une culture informatique générale. Posséder des notions de probabilités et statistiques est recommandé.
Objectifs pédagogiques
Comprendre les concepts d’apprentissage automatique et l’évolution du Big Data vers le Machine Learning
Appréhender les enjeux de l'utilisation du Machine Learning, incluant les bénéfices attendus et des exemples d’usage
Identifier le positionnement du Machine Learning dans la chaîne de traitement de la donnée
Connaitre les outils et les acteurs leaders du marché
Découvrir les principaux algorithmes et la démarche projet à appliquer selon les cas d'usages en entreprise
Identifier les clés de réussite d'un projet intégrant du Machine Learning
Programme détaillé
1.QU’EST-CE QUE LE MACHINE LEARNING ?
- Le changement de paradigme, depuis les systèmes experts à l’apprentissage automatique
- Les cas d’usage des algorithmes et leurs limites
- Les différentes catégories d’algorithmes: Supervisé / Non-supervisé, Instances / Modèle
- Les défis usuels: qualité des données, quantité, biais préexistants
2.ILLUSTRATION DES CONCEPTS SUR UN PROJET TYPE
- Poser la bonne question
- Trouver les données
- Explorer les données: Visualisation et statistiques
- Préparer les données: Outliers, Normalisation, Données catégoriques
- Choisir et entraîner un modèle approprié
- Évaluer les performances du modèle
3.MESURER LES PERFORMANCES D’UN ALGORITHME, ILLUSTRÉ PAR LA CLASSIFICATION
- Classification binaire
- Mesures de performance: Précision et rappel, F1, courbe ROC
- Analyser les erreurs d’un classifieur
- Classification multilabel
4.ENTRAÎNER LES MODÈLES, LE CAS DES RÉGRESSIONS
- Régression linéaire et sa justification mathématique
- Gradient descent et ses variantes
- Overfit/Underfit: les détecter et y remédier
- Régularisation: Principe, Ridge, Lasso et ElasticNet
- Régression logistique pour la classification
5.SVM ET ARBRES DE DÉCISION
- Séparer autant que possible les données, l’idée de base
- Projection dans un espace de dimension supérieur, les kernels
- Arbres de décision, classification et régression
- Apprentissage d’ensemble: Forêts, boosting et stacking
6.RÉDUCTION DE DIMENSION
- Curse of dimensionality
- Projection vs Manifolds
- PCA, l’approche canonique
- PCA avec Kernels
- LLE, T-SNE, etc.