Aller au contenu principal

ASTON INSTITUT : 03. Concevoir et implémenter une solution d’IA pour les Data scientists

Durée

104 heures

Modalités

Formation
  • Mixte
Évaluation

1. Cas d'usage unique (1h) (épreuve orale) 2. Questionnaire à visée professionnelle (45 min) (en ligne)

Certification

Réussite des 2 modalités d'évaluation (cas d'usage unique et questionnaire) - Le coût de la certification est compris dans le coût du stage.

Prix

Inter
La formation en Inter est dispensée pour un groupe de salariés d’entreprises différentes.
8 944 € HT / personne
Certification obligatoire
+ 400 € HT / personne
Intra
La formation en Intra est dispensée pour un groupe de salariés d’une seule et même entreprise.
37 885,71 € HT / groupe
Certification obligatoire
+ 400 € HT / personne
4 stagiaires minimum

Public

Professionnels dont les missions, en termes de traitement de données, sont plus avancées (notamment l'exploration de données avancée, la modélisation statistique et l'utilisation de techniques d'apprentissage automatique et d'intelligence artificielle pour résoudre des problèmes complexes) et qui disposent de compétences déjà solides en mathématiques et statistiques. 

Pré-requis

'-    Exercer un emploi comportant des activités orientées vers la création d’infrastructures, de logiciels, vers le traitement et l’analyse de données ou encore vers la maintenance des systèmes ;
-    Des connaissances en mathématiques et statistiques, en particulier dans l’exploitation de données (statistiques descriptives, probabilités, statistiques inférentielles, analyse exploratoire des données, modélisation statistique) ;
-    Justifier d’une expérience en programmation (1er niveau de maîtrise des langages de programmation, connaissances algorithmes et structures de données, architecture logicielle, systèmes d’exploitation).

Certification

Concevoir et implémenter une solution d’IA

Objectifs pédagogiques

La documentation 
  • Documenter les jeux de données (datasheet, documentation technique)
  • Documenter le flux de traitement des données (donnée source jusqu’à l’exploitation, chaine d’approvisionnement des données) 
  • Documenter le cycle de vie de la donnée 

Les techniques de traitement de données 
  • Prendre en compte les techniques de génération de données (données synthétiques, confidentialité différentielle, etc.)
  • Maitriser les techniques d’augmentation de données 

Adapter la solution selon les enjeux sociétaux et les besoins clients
  • Comprendre les impacts de la solution par rapport au destinataire direct et indirect
  • Connaître, identifier et intégrer les différents risques éthiques et sociétaux associés à l’utilisation de l’IA en fonction du cas d’usage
  • Connaître la réglementation en lien avec la confidentialité et utilisation des données et de l’IA pour les usages sensibles

Mesure et suivi de la performance 
  • Choisir et documenter le modèle de stockage adapté en fonction du cas d’usage et des données sources
  • Maitriser les techniques de versionnage et de mise en production des modèles
  • Maitriser les techniques de Mlops et frameworks associés (MLFlow, …), conteneurisation (docker) et les articuler avec les techniques de Devops
  • Développer des tableaux de bord pour le suivi des performances et les métriques associées
  • Intégrer les retours utilisateurs et les limites d’utilisation (retour du contrôle vers un humain)

Les menaces 
  • Connaître les menaces qui pèsent sur l’élaboration d’une solution d’IA et comprendre l’état de l’art des mécanismes d’atténuation (adversarial example) et évaluer les risques résiduels 

Les connaissances générales liées aux modèles d’IA   
  • Comprendre les modèles d’IA et leurs champs d’application
  • Maîtriser les outils (Tensorflow, Keras, ...) pour faire de L’IA
  • Compréhension, prise de recul par rapport des cas d’usage
  • Intégrer les contraintes opérationnelles (accès aux données, SI, etc…)
  • Sensibilisation Écoconception (ex-gestion de flux de données vertueuse, code optimisé, …)

La modélisation IA
  • Connaissance des différents modèles d’IA et de leurs spécificités (ex. contraintes liées aux différentes formes d’apprentissage

Les méthodes d’apprentissage  
  • Optimiser les méthodes d’apprentissage au regard du jeu de données
  • Elargir les connaissances sur les bibliothèques du marché. 

Industrialisation et architecture  
  • Bonnes pratiques Mlops, versionning, dév. Continu, CI/CD… 
  • Savoir « exposer » l’IA (API, web service, events, etc)
  • Développement d’IHM basiques pour première retitution MVP (Tkinter, Flask, Django, …)
  • Avoir une bonne connaissance des principaux éléments d’architectures impliquées pour l’IA
  • Être capable de challenger les propositions techniques sous les contraintes performance, économique, écologique, …)

Programme détaillé

Module 1 - Documenter les Flux et le Cycle de Vie des Données - Durée : 4 heures

Programme :

1.          Introduction à la documentation du flux de traitement des données (1 heure)

2.          Documentation du cycle de vie de la donnée (1 heure)

3.          Considérations éthiques et réglementaires dans la documentation (1 heure)

4.          Mise en pratique : Atelier de documentation (1 heure)

Module 2 - Documenter et Structurer les Jeux de Données pour l'IA - Durée : 4 heures

Programme :

1.          Introduction à la documentation des jeux de données (1 heure)

2.          Structure et intégrité des données (1 heure)

3.          Considérations éthiques et réglementaires dans la documentation (1 heure)

4.          Mise en pratique : Élaboration d'une documentation technique (1 heure)

Module 3 - Maîtriser les Techniques de Génération et d’Augmentation de Données - Durée : 12 heures

Programme :

1.          Introduction aux Techniques de Génération de Données (4 heures)

2.          Techniques d’Augmentation de Données (4 heures)

3.          Intégration des Techniques de Génération et d’Augmentation de Données dans les Flux de Travail (2 heures)

4.          Évaluation des Techniques et Retours d’Expérience (2 heures)            

Module 4 - Évaluer les Impacts et Réguler l'Utilisation de l'IA - Durée : 14 heures

Programme :

1.          Introduction aux Impacts de l’IA et aux Risques Réglementaires (1h)

2.          Évaluation des Impacts des Solutions d’IA (3h)

3.          Identification et Gestion des Risques Éthiques et Sociétaux (4h)

4.          Réglementation et Confidentialité des Données (3h)

5.          Synthèse et Discussion (2h)

Module 5 - Maîtriser les Modèles et Outils de l’IA tout en Intégrant les Contraintes Opérationnelles et Écologiques - Durée : 14 heures

Programme

1.          Explorer les Modèles d’IA et leurs Applications    (1 heure)

2.          Analyser et Comprendre les Cas d’Usage (3h)

3.          Identifier les Contraintes Opérationnelles et Techniques (4h)

4.          Manipuler TensorFlow et Keras pour le Développement d'IA (3h)

5.          Adopter une Démarche d’Écoconception (2h)

Module 6 - Maîtriser les Modèles d'IA et leurs Spécificités - Durée : 8 heures   

Programme  

1.          Introduction aux Modèles d'IA Programme (30 min)

2.          Étude des Contraintes liées aux Modèles d'Apprentissage (2h)

3.          Préparation des Données pour les Modèles d'IA (1h30)

4.          Choisir et Entraîner un Modèle d'IA (1h)    

5.          Évaluer et Optimiser les Performances des Modèles (2h)

6.          Amélioration Continue et Suivi des Modèles – (1h)

Module 7 - Optimiser les Méthodes d'Apprentissage et Explorer les Bibliothèques du Marché - Durée : 8 heures

Programme :

1.          Introduction et Objectifs du Programme (30 min)

2.          Optimisation des Méthodes d'Apprentissage (2h)

3.          Cas pratiques : ajustement des paramètres et évaluation des performances Exploration des Bibliothèques du Marché (3h)

4.          Intégration et Validation des Modèles (1h30)

5.          Synthèse et Évaluation (1h)

Module 8 - Maîtriser les Pratiques Avancées de Développement et de Déploiement de Solutions d'IA - Durée : 16 heures

Programme :  14

1.          Mettre en œuvre les pratiques MLOps pour les projets IA (4h)

2.          Exposer et intégrer l’IA via des API et Web Services (4h)

3.          Développer des interfaces utilisateurs basiques pour IA (3h)     

4.          Concevoir l’architecture technique des projets IA (3h)

5.          Challenger les Propositions Techniques sous Contrainte (2h)     

Module 9 - Choisir et Documenter le Modèle de Stockage - Durée : 2 heures

Programme :

1.          Introduction aux Modèles de Stockage de Données (30 min)    

2.          Choix du Modèle de Stockage en Fonction du Cas d’Usage (30 min)

3.          Documentation du Modèle de Stockage (30 min)

4.          Synthèse et Questions-Réponses (30 min)

Module 10 - Maîtriser les Techniques de Versionnage, MLOps, et Suivi des Performances  - Durée : 14 heures

Programme :

1.          Introduction aux Techniques de Versionnage et Mise en Production (3 heures)

2.          Maîtriser les Techniques de MLOps et Frameworks Associés (4 heures)

3.          Développer des Tableaux de Bord pour le Suivi des Performances (3 heures)     

4.          Intégrer les Retours Utilisateurs et les Limites d’Utilisation (2 heures)

5.          Synthèse et Questions-Réponses (2 heures)

Module 11 - Analyser les Menaces et Atténuer les Risques dans les Solutions d'IA - Durée : 8 heures

Programme :

1.          Introduction aux Menaces et Risques en IA (1h)  

2.          Identification des Risques Éthiques et Sociétaux (2h)

3.          Mécanismes d'Atténuation des Attaques Adversariales (3h)

4.          Évaluation des Risques Résiduels et Sécurité des Modèles (1h30)

5.          Synthèse et Évaluation (30 min)

Sessions

Filtrer les résultats
Modalités pédagogiques
Formation synchrone se déroulant avec la présence physique du (des) formateur(s) et du (des) apprenant(s) réunis dans un même lieu de formation.
Formation combinant des séquences en présentiel et des séquences à distance synchrones ou asynchrones.
Formation à distance, asynchrone, s’appuyant sur une plateforme d’apprentissage, pouvant être complétée par d’autres modalités de formation à distance (visio-conférence…)
Formation à distance, synchrone, s’appuyant sur un dispositif de visio-conférence. La classe virtuelle recrée à distance les conditions d’une formation en salle traditionnelle.
Type de formation
La formation en Inter est dispensée pour un groupe de salariés d’entreprises différentes.
La formation en Intra est dispensée pour un groupe de salariés d’une seule et même entreprise.
Options
Les compétences professionnelles visées par la formation sont validées via un test permettant d’obtenir une certification officielle.
Ces sessions ne peuvent être ni annulées ni reportées par l’organisme de formation.