ORSYS : 10. Les fondamentaux de l'analyse statistique avec R
Organisme
92044 PARIS LA DEFENSE CEDEXVoir toutes ses formationsAutres organismes proposant cette formation
Durée
Modalités
- Classe virtuelle
- Présentiel
Le formateur évalue la progression pédagogique du participant tout au long de la formation au moyen de QCM, mise en pratique des connaissances théoriques sur la base de jeux de données variés.
Prix
Public
Ingénieurs, Data analysts, statisticiens, développeurs en environnement statistique ou toute personne intéressée par l'analyse statistique avec R
Pré-requis
Être familier avec l'environnement Microsoft Windows et avoir des connaissances de base en statistiques
Objectifs pédagogiques
Savoir installer et utiliser l’environnement d'analyse R
Comprendre comment manipuler des données avec R
Savoir importer et exporter des données
Savoir reconnaître les différents types d'objets de R
Créer des programmes d'analyse avec R
Être en mesure de réaliser des analyses statistiques basiques avec R
Savoir restituer des résultats à l'aide de graphiques
Programme détaillé
Environnement R, traitement de données et analyse statistique
Environnement logiciel Open Source et langage, R est spécialisé dans les traitements statistiques. Ce cours vous apprendra à programmer en R, à utiliser l'éditeur R studio, à exploiter les possibilités de visualisation des datas et à appliquer des algorithmes statistiques fondamentaux : régressions, ACP, CAH.
Objectifs pédagogiques
À l’issue de la formation, le participant sera en mesure de :
- Savoir installer et utiliser l'environnement d'analyse R
- Savoir importer et exporter des données
- Savoir reconnaître les différents types d'objets de R
- Créer des programmes d'analyse avec R
- Être en mesure de réaliser des analyses statistiques basiques avec R
- Comprendre comment manipuler des données avec R
- Savoir restituer des résultats à l'aide de graphiques
Déroulement de la formation :
- Introduction
- Premiers pas
- Objets et notions de programmation R
- Création et utilisation de fonctions
- Génération, gestion et visualisation des données
- Analyses statistiques
Programme détaillé de la formation :
Introduction
- Présentation du logiciel R et de ses fonctionnalités.
- Avantages et inconvénients.
- Accès au site de téléchargement de l'outil et installation.
Travaux pratiques
Installation de l'environnement d'analyse.
Premiers pas
- Environnement de base (console, script).
- Utilisation de la console.
- Création et sauvegarde d'un script.
- Le répertoire sous R Installation.
- Aide et commentaires.
- Les autres éditeurs Tinn-R et R Studio.
Travaux pratiques
Manipulations de la console. Ecriture de scripts.
Objets et notions de programmation R
- Les objets de type vecteurs, matrix, array, factor, data.frame, list.
- Manipulation des objets, classe d'objet, fonctions spécifiques, jointure.
- Sauvegarde, suppression de mémoire.
- Notions de boucle (for et while), condition (if), switch.
Travaux pratiques
Ecriture de programmes R manipulant des types d’objets.
Création et utilisation de fonctions
- Structure d'une fonction.
- Fonctions de type mathématique.
- Fonctions de type chaîne de caractères.
- Fonctions liées au temps/date.
- Opérations ensemblistes.
- Les tables de contingences.
Travaux pratiques
Création de fonctions et utilisation de celles-ci dans les programmes R.
Génération, gestion et visualisation des données
- Les données : séquences régulières et aléatoires.
- Données exemples de R.
- Importation et exportation de données.
- Modifier les données d'un objet.
- Exemples de graphiques construits avec R.
- Création des graphiques de base.
- Les options graphiques, partager une fenêtre graphique, sauvegarder un graphique.
Travaux pratiques
Exercices d'application sur les données, restitution des résultats avec des graphiques.
Analyses statistiques
- Présentation de la notion de package (librairie).
- Télécharger/charger des packages.
- Quelques packages utiles.
- Cas de la régression linéaire multiple.
- Cas de l'analyse en composantes principales ACP.
- Cas de la classification CAH.
Travaux pratiques
Poursuite d’écriture de programmes statistiques, intégration des packages.