DOCAPOSTE INSTITUTE : 08. Modélisation statistique, l'essentiel
Organisme
94200 IVRY-SUR-SEINEVoir toutes ses formationsAutres organismes proposant cette formation
Durée
Modalités
- Classe virtuelle
- Présentiel
Tout au long et/ou à l’issue de la formation : évaluation des acquis des stagiaires via des exercices, des QCM, des QUIZZ, des mises en situation et/ou des cas pratiques.
Prix
Public
utilisateurs et gestionnaires métiers de bases de données, Data Scientist, ingénieurs, Data Analysts ou toute personne intéressée par l'analyse statistique appliquée
Pré-requis
Connaissances générales en mathématiques, analyse statistique et Excel.
Objectifs pédagogiques
Connaître les fondamentaux de l'analyse statistique appliquée
Maîtriser l'utilisation des formules et tests statistiques fondamentaux
Savoir concevoir un rapport d'analyse basé sur les faits
Exploiter les paramètres statistiques pour comprendre une série de données
Découvrir des outils comme R et Excel pour la mise en œuvre des modèles étudiés
Valider la précision d'une estimation, à l'aide des intervalles de confiance
Être en mesure de prévoir les comportements à venir
Savoir vérifier l'adéquation à un modèle
Programme détaillé
Généralités sur les modèles
- Une représentation du réel
- Buts et utilités d'un modèle
- Domaines d'applications
- Modèles mathématiques
- Modélisation stochastique
Domaines d'utilisation
- Statistiques officielles
- Presse, médias
- Banques – assurances
- Sciences de la vie
- Environnement (foresterie, pêche …)
- Santé
- Sciences humaines
- Entreprises & industrie
- Finance
- Recherche fondamentale et appliquée
Techniques de modélisation
- Analyse de données
- Probabilités / statistiques
- Théorie de l'information
- Intelligence artificielle
- Base de données
- Datavisualisation
Modèles préliminaires
- Nettoyage des données
- Exploration des données
- Transformation / regroupement de variables
Méthodes statistiques non paramétriques
- Méthodes d'estimation
- Tests non paramétriques
- Test d'égalité de distributions Kolmogorov-Smirnov
- Statistique semi-paramétrique
Modèles paramétriques classiques
- Modèle linéaire (gaussien) de base
- Modèle linéaire généralisé
- Modèles linéaires généralisés
- Modèles mixtes
Paramètre de position et de dispersion
- Mode, valeur modale, valeur la plus probable
- Moyenne d'une population (ou d'un échantillon)
- Médiane, partager une série numérique
- Etendue, différence entre valeurs extrêmes.
- Utiliser les quantiles
- Ecart-Type, calculer la dispersion d'un ensemble de données.
- Calcul de la variance et de la covariance
Etude de cas : Calcul de paramètres de position et de dispersion sur différents échantillonnages et comparaisons des résultats.
Tests et intervalle de confiance
- Lois statistiques et intervalle de confiance.
- Tests statistiques courants (Test de Student, Analyse de variances, Khi²).
- Valider la précision d'une estimation.
- Amplitude de l'intervalle.
Etude de cas : Exercices sur le logiciel R.