Aller au contenu principal

ORSYS : 10. Les fondamentaux de l'analyse statistique avec R

Durée

14 heures

Modalités

Formation
  • Classe virtuelle
  • Présentiel
Évaluation

Le formateur évalue la progression pédagogique du participant tout au long de la formation au moyen de QCM, mise en pratique des connaissances théoriques sur la base de jeux de données variés.

Prix

Inter
La formation en Inter est dispensée pour un groupe de salariés d’entreprises différentes.
735€ HT / personne
Intra
La formation en Intra est dispensée pour un groupe de salariés d’une seule et même entreprise.
3307.5€ HT / groupe
4 stagiaires minimum

Public

Ingénieurs, Data analysts, statisticiens, développeurs en environnement statistique ou toute personne intéressée par l'analyse statistique avec R

Pré-requis

Être familier avec l'environnement Microsoft Windows et avoir des connaissances de base en statistiques

Objectifs pédagogiques

Savoir installer et utiliser l’environnement d'analyse R

Comprendre comment manipuler des données avec R

Savoir importer et exporter des données

Savoir reconnaître les différents types d'objets de R

Créer des programmes d'analyse avec R

Être en mesure de réaliser des analyses statistiques basiques avec R

Savoir restituer des résultats à l'aide de graphiques

Programme détaillé

Environnement R, traitement de données et analyse statistique

Environnement logiciel Open Source et langage, R est spécialisé dans les traitements statistiques. Ce cours vous apprendra à programmer en R, à utiliser l'éditeur R studio, à exploiter les possibilités de visualisation des datas et à appliquer des algorithmes statistiques fondamentaux : régressions, ACP, CAH.

 

Objectifs pédagogiques

À l’issue de la formation, le participant sera en mesure de :

  1. Savoir installer et utiliser l'environnement d'analyse R
  2. Savoir importer et exporter des données
  3. Savoir reconnaître les différents types d'objets de R
  4. Créer des programmes d'analyse avec R
  5. Être en mesure de réaliser des analyses statistiques basiques avec R
  6. Comprendre comment manipuler des données avec R
  7. Savoir restituer des résultats à l'aide de graphiques

 

Déroulement de la formation :

  1. Introduction
  2. Premiers pas
  3. Objets et notions de programmation R
  4. Création et utilisation de fonctions
  5. Génération, gestion et visualisation des données
  6. Analyses statistiques

 

Programme détaillé de la formation :

Introduction

  • Présentation du logiciel R et de ses fonctionnalités.
  • Avantages et inconvénients.
  • Accès au site de téléchargement de l'outil et installation.

Travaux pratiques

Installation de l'environnement d'analyse.  

 

Premiers pas

  • Environnement de base (console, script).
  • Utilisation de la console.
  • Création et sauvegarde d'un script.
  • Le répertoire sous R Installation.
  • Aide et commentaires.
  • Les autres éditeurs Tinn-R et R Studio.

Travaux pratiques

Manipulations de la console. Ecriture de scripts.  

 

Objets et notions de programmation R

  • Les objets de type vecteurs, matrix, array, factor, data.frame, list.
  • Manipulation des objets, classe d'objet, fonctions spécifiques, jointure.
  • Sauvegarde, suppression de mémoire.
  • Notions de boucle (for et while), condition (if), switch.

Travaux pratiques

Ecriture de programmes R manipulant des types d’objets.  

 

Création et utilisation de fonctions

  • Structure d'une fonction.
  • Fonctions de type mathématique.
  • Fonctions de type chaîne de caractères.
  • Fonctions liées au temps/date.
  • Opérations ensemblistes.
  • Les tables de contingences.

Travaux pratiques

Création de fonctions et utilisation de celles-ci dans les programmes R.  

 

Génération, gestion et visualisation des données

  • Les données : séquences régulières et aléatoires.
  • Données exemples de R.
  • Importation et exportation de données.
  • Modifier les données d'un objet.
  • Exemples de graphiques construits avec R.
  • Création des graphiques de base.
  • Les options graphiques, partager une fenêtre graphique, sauvegarder un graphique.

Travaux pratiques

Exercices d'application sur les données, restitution des résultats avec des graphiques.  

 

Analyses statistiques

  • Présentation de la notion de package (librairie).
  • Télécharger/charger des packages.
  • Quelques packages utiles.
  • Cas de la régression linéaire multiple.
  • Cas de l'analyse en composantes principales ACP.
  • Cas de la classification CAH.

Travaux pratiques

Poursuite d’écriture de programmes statistiques, intégration des packages.

 

Sessions

Filtrer les résultats
Modalités pédagogiques
Formation synchrone se déroulant avec la présence physique du (des) formateur(s) et du (des) apprenant(s) réunis dans un même lieu de formation.
Formation combinant des séquences en présentiel et des séquences à distance synchrones ou asynchrones.
Formation à distance, asynchrone, s’appuyant sur une plateforme d’apprentissage, pouvant être complétée par d’autres modalités de formation à distance (visio-conférence…)
Formation à distance, synchrone, s’appuyant sur un dispositif de visio-conférence. La classe virtuelle recrée à distance les conditions d’une formation en salle traditionnelle.
Type de formation
La formation en Inter est dispensée pour un groupe de salariés d’entreprises différentes.
La formation en Intra est dispensée pour un groupe de salariés d’une seule et même entreprise.
Options
Les compétences professionnelles visées par la formation sont validées via un test permettant d’obtenir une certification officielle.
Ces sessions ne peuvent être ni annulées ni reportées par l’organisme de formation.