ASTON INSTITUT : 02. Concevoir et implémenter une solution d’IA pour les Professionnels IT
Organisme
92300 LEVALLOIS PERRETVoir toutes ses formationsAutres organismes proposant cette formation
Durée
Modalités
- Mixte
1. Cas d'usage unique (1h) (épreuve orale) 2. Questionnaire à visée professionnelle (45 min) (en ligne)
Réussite des 2 modalités d'évaluation (cas d'usage unique et questionnaire) - Le coût de la certification est compris dans le coût du stage.
Prix
Public
Professionnels de l’IT dont :
- le cœur de métier n’est pas initialement l’exploitation des données,
- l’expertise et les finalités se concentrent sur la gestion et l'optimisation des systèmes et de l'infrastructure informatiques et non sur l'exploitation des données pour prendre des décisions (développeur informatique, spécialiste BDD, consultant AT, spécialiste infrastructure, spécialiste systèmes, réseaux et sécurité, intégrateur logiciel...)
Pré-requis
- Des connaissances en mathématiques et statistiques, en particulier dans l’exploitation de données (statistiques descriptives, probabilités, statistiques inférentielles, analyse exploratoire des données, modélisation statistique) ;
- Justifier d’une expérience en programmation (1er niveau de maîtrise des langages de programmation, connaissances algorithmes et structures de données, architecture logicielle, systèmes d’exploitation)
Certification
Objectifs pédagogiques
- Documenter les jeux de données (datasheet, documentation technique)
- Documenter le flux de traitement des données (donnée source jusqu’à l’exploitation, chaine d’approvisionnement des données)
- Documenter le cycle de vie de la donnée
Les techniques de traitement de données
- Prendre en compte les techniques de génération de données (données synthétiques, confidentialité différentielle, etc.)
- Maitriser les techniques d’augmentation de données
La préparation des données
- Evaluer la qualité et la pertinence des données (visualisation, indicateurs (de cohérence), distribution, etc.)
- Identifier les biais les plus courants et leurs atténuations et évaluer les risques résiduels
- Intégrer et maitriser les méthodes de base de data-cleaning (renseigner données manquantes, identifier les données aberrantes, etc.)
Adapter la solution selon les enjeux sociétaux et les besoins clients
- Comprendre les impacts de la solution par rapport au destinataire direct et indirect
- Connaître, identifier et intégrer les différents risques éthiques et sociétaux associés à l’utilisation de l’IA en fonction du cas d’usage
- Connaître la réglementation en lien avec la confidentialité et utilisation des données et de l’IA pour les usages sensibles
- Connaitre les besoins métiers et comprendre les besoins exprimés
- Comprendre le cas d’usage en fonction des besoins métiers
Mesure et suivi de la performance
- Identifier et corriger les dérives du modèle (apprentissage en continu avec des dérives liées aux nouvelles données)
- Identifier, définir et mesurer les indicateurs de performance dès la conception de la solution
- Analyser et ré-évaluer de manière périodique les indicateurs de performance
- Choisir et documenter le modèle de stockage adapté en fonction du cas d’usage et des données sources
- Maitriser les techniques de versionnage et de mise en production des modèles
- Maitriser les techniques de Mlops et frameworks associés (MLFlow, …), conteneurisation (docker) et les articuler avec les techniques de Devops
- Développer des tableaux de bord pour le suivi des performances et les métriques associées
- Intégrer les retours utilisateurs et les limites d’utilisation (retour du contrôle vers un humain)
Les menaces
- Connaître les menaces qui pèsent sur l’élaboration d’une solution d’IA et comprendre l’état de l’art des mécanismes d’atténuation (adversarial example) et évaluer les risques résiduels
Les connaissances générales liées aux modèles d’IA
- Comprendre les modèles d’IA et leurs champs d’application
- Maîtriser les outils (Tensorflow, Keras, ...) pour faire de L’IA
- Compréhension, prise de recul par rapport des cas d’usage
- Intégrer les contraintes opérationnelles (accès aux données, SI, etc…)
- Sensibilisation Écoconception (ex-gestion de flux de données vertueuse, code optimisé, …)
- Apprendre les bonnes pratiques pour gérer un projet d'Intelligence artificielle
- Maîtriser les bases et les bibliothèques de Python, et leur application à l’intelligence artificielle
La modélisation IA
- Connaissance des différents modèles d’IA et de leurs spécificités (ex. contraintes liées aux différentes formes d’apprentissage
- Apprendre à développer en Python des modèles de IA (prédiction, classification, réseaux de neurones)
- Maitriser les environnements de développement de l’IA (Notebook Jupyter, …)
Les méthodes d’apprentissage
- Apprendre à Optimiser le code & automatiser des tâches
- Optimiser les méthodes d’apprentissage au regard du jeu de données
- Elargir les connaissances sur les bibliothèques du marché.
Industrialisation et architecture
- Bonnes pratiques Mlops, versionning, dév. Continu, CI/CD… Savoir « exposer » l’IA (API, web service, events, etc)
- Développement d’IHM basiques pour première retitution MVP (Tkinter, Flask, Django, …)
- Avoir une bonne connaissance des principaux éléments d’architectures impliquées pour l’IA
- Être capable de challenger les propositions techniques sous les contraintes performance, économique, écologique, …)
- Apprendre à utiliser des outils de monitoring d’entrainement de type Tensorboard
- Apprendre à utiliser les bibliothèques d’optimisation de modèles de type Optuna
- Avoir des notions d’architecture d’un système d’information intégrant de L’IA
Programme détaillé
Module 1: Documenter les Flux et le Cycle de Vie des Données : Durée 4 heures
Programme :
1.Introduction à la documentation du flux de traitement des données (1 heure)
2.Documentation du cycle de vie de la donnée (1 heure)
3.Considérations éthiques et réglementaires dans la documentation (1 heure)
4.Mise en pratique : Atelier de documentation (1 heure)
Module 2: Documenter et Structurer les Jeux de Données pour l'IA : Durée 4 heures
Programme :
1.Introduction aux Techniques de Génération de Données (1 heures)
2.Structure et intégrité des données (1 heure)
3.Considérations éthiques et réglementaires dans la documentation (1 heure)
4.Mise en pratique : Élaboration d'une documentation technique (1 heure)
Module 3: Maîtriser les Techniques de Génération et d’Augmentation de Données : Durée 12 heures
Programme :
1.Introduction aux Techniques de Génération de Données (4 heures)
2.Techniques d’Augmentation de Données (4 heures)
3.Intégration des Techniques de Génération et d’Augmentation de Données dans les
Flux de Travail (2 heures)
4.Évaluation des Techniques et Retours d’Expérience (2 heures
Module 4: Identifier et Valider les Sources de Données Pertinentes : 2 heures
Programme :
1.Introduction (15 min)
2.Session 1 : Identifier les Critères de Pertinence et d’Accessibilité des Sources de Données (45 Min)
3.Session 2 : Évaluer les Risques Éthiques et Sociétaux des Sources de Données (30 min)
4.Session 3 : Utiliser les Techniques et Outils pour Valider les Sources de Données (30 min)
5.Conclusion et Évaluation (30 min
Module 5: Évaluer et Nettoyer des Donnée : Durée 12 heures
Programme :
1.Introduction (1h)
2.Session 1 : Évaluation de la qualité et de la pertinence des données (4h)
3.Session 2 : Identification des biais et évaluation des risques résiduels (4h)
4.Session 3 : Data-Cleaning : Méthodes et applications (4h)
5.Conclusion et Évaluation (1h)
Module 6 : Analyser les Besoins Métiers et les Cas d’Usage : Durée 4 heures
Programme :
1.Introduction et Objectifs du Programme (30 min)
2.Identification des Besoins Métiers (1h 30 min)
3.Analyse des Cas d’Usage (1h 30 min)
4.Synthèse et Application Pratique (1h)
Module 7 : Évaluer les Impacts et Réguler l'Utilisation de l'IA : Durée 14 heures
Programme :
1.Introduction aux Impacts de l’IA et aux Risques Réglementaires (1h)
2.Évaluation des Impacts des Solutions d’IA (3h)
3.Identification et Gestion des Risques Éthiques et Sociétaux (4h)
4.Réglementation et Confidentialité des Données (3h)
5.Synthèse et Discussion (2h)
Module 8 : Développer des Compétences en IA et Maîtriser la Programmation en Python et R : Durée 4 heures
Programme :
1.Identifier les objectifs et domaines d'application de l'IA
2.Maîtriser les bases mathématiques appliquées à l'IA
3.Comprendre les algorithmes d'IA et leur fonctionnement
4.Apprendre la programmation Python et R pour l'IA
5. Manipuler des bases de données avec Python
Module 9 : Gérer un Projet d'IA et Maîtriser les Bibliothèques Python : Durée 2 heures
Programme :
1.Appliquer les bonnes pratiques de gestion de projet IA
2.Maîtriser Python et les bibliothèques pour l’IA
Module 10 : Maîtriser les Modèles et Outils de l’IA tout en Intégrant les Contraintes Opérationnelles et Écologiques : Durée : 14 heures
Programme :
1.Explorer les Modèles d’IA et leurs Applications
2.Analyser et Comprendre les Cas d’Usage
3.Identifier les Contraintes Opérationnelles et Techniques
4.Manipuler TensorFlow et Keras pour le Développement d'IA
5.Adopter une Démarche d’Écoconception
Module 11 : Maîtriser les Modèles d'IA et leurs Spécificités : Durée : 8 heures
Programme :
1.Introduction aux Modèles d'IA
2. Étude des Contraintes liées aux Modèles d'Apprentissage
3. Préparation des Données pour les Modèles d'IA
4. Choisir et Entraîner un Modèle d'IA
5. Évaluer et Optimiser les Performances des Modèles
6. Amélioration Continue et Suivi des Modèles
Module 12 : Développer et Exploiter des Modèles d'IA avec Python : Durée : 6 heures
Programme :
1.Introduction au Développement de Modèles IA avec Python
2.Réseaux de Neurones en Python
3.Maîtriser les Environnements de Développement IA
4.Optimisation et Suivi des Modèles IA en Production
Module 13 : Optimiser le Code et Automatiser les Tâches : Durée : 6 heures
Programme :
1.Introduction et Objectifs du Programme (30 min)
2.Optimisation du Code (1h30)
3.Automatisation des Tâches (2h)
4.Qualité du Code et Intégration Continue (1h30
5.Synthèse et Évaluation (30 min)
Module 14 : Optimiser les Méthodes d'Apprentissage et Explorer les Bibliothèques du Marché : Durée : 8 heures
Programme :
1.Introduction et Objectifs du Programme (30 min)
2.Optimisation des Méthodes d'Apprentissage (2h
3.Exploration des Bibliothèques du Marché (3h)
4.Intégration et Validation des Modèles (1h30)
5.Synthèse et Évaluation (1h)
Module 15 : Maîtriser les Architectures et Services IA des Hyperscalers : Durée : 4 heures
Programme :
1.Développer des Compétences en Architectures pour l'IA (2 heures)
2.Utiliser les Services des Hyperscalers pour l’IA (2 heures)
Module 16 : Optimiser et Monitorer l'Entraînement des Modèles IA: Durée : 2 heures
Programme :
1.Monitorer l’Entraînement avec TensorBoard (45 min)
2.Optimiser les Modèles avec Optuna (45 min)
3.Notions d'Architecture pour l’Intégration de l’IA (30 min)
Module 17 : Maîtriser les Pratiques Avancées de Développement et de Déploiement de Solutions d'IA : Durée : 16 heures
Programme :
1.Mettre en œuvre les pratiques MLOps pour les projets IA (4h)
2.Exposer et intégrer l’IA via des API et Web Services (4h)
3.Développer des interfaces utilisateurs basiques pour IA (3h)
4.Concevoir l’architecture technique des projets IA (3h)
5.Challenger les Propositions Techniques sous Contrainte (2h)
Module 18 : Identifier et Corriger les Dérives du Modèle d’IA: Durée : 2 heures
Programme :
1.Introduction aux Dérives de Modèle (30 min)
2.Identification des Dérives (30 min)
3.Correction des Dérives (30 min)
4.Synthèse et Discussion (30 min)
Module 19 : Identifier, Définir et Évaluer les Indicateurs de Performance : 4 heures
Programme :
1.Introduction aux Indicateurs de Performance (30 min)
2.Identification et Définition des Indicateurs de Performance (60 min
3.Mesure des Indicateurs de Performance (30 min)
4.Analyse et Réévaluation Périodique des Indicateurs (60 min)
5.Synthèse et Discussion (30 min)
Module 20 : Choisir et Documenter le Modèle de Stockage : 2 heures
Programme :
1.Introduction aux Modèles de Stockage de Données (30 min)
2.Choix du Modèle de Stockage en Fonction du Cas d’Usage (30 min)
3.Documentation du Modèle de Stockage (30 min)
4.Synthèse et Questions-Réponses (30 min)
Module 21 : Maîtriser les Techniques de Versionnage, MLOps, et Suivi des Performances : 14 heures
Programme :
1.Introduction aux Techniques de Versionnage et Mise en Production (3 heures)
2.Maîtriser les Techniques de MLOps et Frameworks Associés (4 heures)
3.Développer des Tableaux de Bord pour le Suivi des Performances (3 heures)
4.Intégrer les Retours Utilisateurs et les Limites d’Utilisation (2 heures)
5.Synthèse et Questions-Réponses (2 heures)
Module 22 : Analyser les Menaces et Atténuer les Risques dans les Solutions d'IA: 8 heures
Programme :
1.Introduction aux Menaces et Risques en IA (1h)
2.Identification des Risques Éthiques et Sociétaux (2h)
3.Mécanismes d'Atténuation des Attaques Adversariales (3h)
4.Évaluation des Risques Résiduels et Sécurité des Modèles (1h30)
5.Synthèse et Évaluation (30 min)