AELION : 03. Concevoir et implémenter une solution d’IA pour les Data scientists
Organisme
31200 TOULOUSEVoir toutes ses formationsAutres organismes proposant cette formation
Durée
Modalités
- Mixte
1. Cas d'usage unique (1h) (épreuve orale) 2. Questionnaire à visée professionnelle (45 min) (en ligne)
Réussite des 2 modalités d'évaluation (cas d'usage unique et questionnaire) - Le coût de la certification est compris dans le coût du stage.
Prix
Public
Pré-requis
- Des connaissances en mathématiques et statistiques, en particulier dans l’exploitation de données (statistiques descriptives, probabilités, statistiques inférentielles, analyse exploratoire des données, modélisation statistique) ;
- Justifier d’une expérience en programmation (1er niveau de maîtrise des langages de programmation, connaissances algorithmes et structures de données, architecture logicielle, systèmes d’exploitation).
Certification
Objectifs pédagogiques
- Documenter les jeux de données (datasheet, documentation technique)
- Documenter le flux de traitement des données (donnée source jusqu’à l’exploitation, chaine d’approvisionnement des données)
- Documenter le cycle de vie de la donnée
Les techniques de traitement de données
- Prendre en compte les techniques de génération de données (données synthétiques, confidentialité différentielle, etc.)
- Maitriser les techniques d’augmentation de données
Adapter la solution selon les enjeux sociétaux et les besoins clients
- Comprendre les impacts de la solution par rapport au destinataire direct et indirect
- Connaître, identifier et intégrer les différents risques éthiques et sociétaux associés à l’utilisation de l’IA en fonction du cas d’usage
- Connaître la réglementation en lien avec la confidentialité et utilisation des données et de l’IA pour les usages sensibles
Mesure et suivi de la performance
- Choisir et documenter le modèle de stockage adapté en fonction du cas d’usage et des données sources
- Maitriser les techniques de versionnage et de mise en production des modèles
- Maitriser les techniques de Mlops et frameworks associés (MLFlow, …), conteneurisation (docker) et les articuler avec les techniques de Devops
- Développer des tableaux de bord pour le suivi des performances et les métriques associées
- Intégrer les retours utilisateurs et les limites d’utilisation (retour du contrôle vers un humain)
Les menaces
- Connaître les menaces qui pèsent sur l’élaboration d’une solution d’IA et comprendre l’état de l’art des mécanismes d’atténuation (adversarial example) et évaluer les risques résiduels
Les connaissances générales liées aux modèles d’IA
- Comprendre les modèles d’IA et leurs champs d’application
- Maîtriser les outils (Tensorflow, Keras, ...) pour faire de L’IA
- Compréhension, prise de recul par rapport des cas d’usage
- Intégrer les contraintes opérationnelles (accès aux données, SI, etc…)
- Sensibilisation Écoconception (ex-gestion de flux de données vertueuse, code optimisé, …)
La modélisation IA
- Connaissance des différents modèles d’IA et de leurs spécificités (ex. contraintes liées aux différentes formes d’apprentissage
Les méthodes d’apprentissage
- Optimiser les méthodes d’apprentissage au regard du jeu de données
- Elargir les connaissances sur les bibliothèques du marché.
Industrialisation et architecture
- Bonnes pratiques Mlops, versionning, dév. Continu, CI/CD…
- Savoir « exposer » l’IA (API, web service, events, etc)
- Développement d’IHM basiques pour première retitution MVP (Tkinter, Flask, Django, …)
- Avoir une bonne connaissance des principaux éléments d’architectures impliquées pour l’IA
- Être capable de challenger les propositions techniques sous les contraintes performance, économique, écologique, …)
Programme détaillé
Documentation
Durée : 8 heures
Conception de jeu de donnée
Technique de traitement de donnée
Durée : 12 heures
Technique de traitement de donnée
Evaluation de connaissance
Adaptation de la solution aux enjeux sociétaux et besoins clients
Durée : 14 heures
Identifier les risques éthiques et sociétaux
Identifier et corriger les dérives du modèle
Analyser et réévaluer de manière périodique les indicateurs de performance
Intégrer les retours utilisateurs et les limites d’utilisation
Mesure et suivi de performance
Durée : 16 heures
Analyser et réévaluer de manière périodique les indicateurs de performance
Comprendre les objectifs et les domaines d’applications de l’IA
L’automatisation des corrections des modèles
Outils de monitoring d’entrainement
Evaluation de connaissance
Menaces
Durée : 8 heures
Introduction aux menaces
Attaques adversariales
Empoisonnement des données
Stockage de la donnée
Fuites d’informations
Évaluer les risques résiduels après l’application des mécanismes de défenses
Evaluation de connaissance
Connaissance générales liés aux modèles IA
Durée : 14 heures
Introduction aux différents modèles d’IA
Développer des modèles d’IA en python
Développer des réseaux de neurones
Evaluation de connaissance
Modélisation IA
Durée : 8 heures
Prise de recul par rapport à des cas d’usage
Sensibilisation à l’ecoconception et au code optimisé
Apprendre les bonnes pratiques pour gérer un projet d’IA
Maîtriser les bases et les bibliothèques de Python pour l’IA
Comprendre les objectifs et les domaines d’application de l’IA
Intégration d’agents dans la conception
Evaluation de connaissance
Les Méthodes d’apprentissage
Durée : 8 heures
Maîtriser les environnements de développement
L’optimisation du code
Optimiser les méthodes d’apprentissage en fonction du jeu de donnée
Evaluation de connaissance
L'industrialisation et architecture
Durée : 16 heures
Introduction aux bonnes pratiques MLOps
Exposer un modèle IA
Maîtriser les techniques de versionnage et de mise en production des modèles
Optimisation du cycle de vide des composents
Intégrer les retours utilisateurs et les limites d’utilisations
Évaluation de la qualité et de la pertinence des donnés
Intégration et déploiement continue
Evaluation de connaissance