Français Anglais

Collège Doctoral Université de Montpellier

Retour à la liste

5.1 - Le système R niveau I - Démarrer avec RStudio,Tidyverse et Rmarkdown pour manipuler ses données et faire ses graphiques [Participation : Présentiel]

Contact : Collège Doctoral de l'Université de Montpellier
formations-college@umontpellier.fr

Catégorie : Outils transverses

Langue de l'intervention : français

Nombre d'heures : 14

Min participants : 5

Max participants : 15

Nbre d'inscrits : 8

Nombre de places disponibles : 7

Public prioritaire : Aucun

Public concerné :
Doctorant(e)s

Proposé par : Collège Doctoral Université de Montpellier


Lieu : Salle 1 du Collège Doctoral Campus Triolet Bat 3
Observations : 2 jours
Mots clés : RStudio, tidyverse, rmarkdown
Début de la formation : 26 mai 2026
Fin de la formation : 27 mai 2026
Date ouverture des inscriptions :
Date fermeture des inscriptions : 20 mai 2026

Objectifs :
L’objectif de la formation est d’acquérir les bases de Rstudio, du Tidyverse et de Rmarkdown, pour la manipulation de tableaux, la production de graphiques et la production de rapports. Cette formation se concentre sur les étapes de l’analyse de données en amont de l’analyse statistique et est basée sur le package et langage Tidyverse, conçu spécifiquement pour la manipulation de données et la production de graphiques.

Programme :
JOUR 1
Séquence 1 : RStudio, bases de R et Rmarkdown
- L’interface RStudio: les 4 fenêtres, les menus déroulants
- La création d’objet et l’assignation, les fonctions, les classes (vecteurs numériques, vecteurs de caractères, dataframe) d’objets et les types de variables (facteur, date)
- Création et utilisation d’un document Rmarkdown

Séquence 2 : la syntaxe du Tidyverse
- La syntaxe d’un graphique avec le package ggplot2
- La syntaxe de la manipulation de tableaux et la manipulation de colonnes avec le package dplyr

Séquence 3 : vision d’ensemble de la chaine du traitement de données
- Importer ses données, visualiser les données brutes, modifier le type des variables, transformer les données (calculs de moyennes, sélection de lignes), visualiser les données transformées

Séquence 4 : les tableaux de données à nombreuses variables
- Opérations conditionnelles, gestion des données manquantes
- Représentation de combinaisons de variables sur le même graphique, représentation des écart-types

JOUR 2
Séquence 5 : l’amélioration des graphiques
- Les 4 types de calques de ggplot2 et les différents types de modification (couleurs, axes, légendes, polices)

Séquence 6 : fusion de tableaux
- Les deux manières essentielles de joindre des tableaux (collés et fusionnés)

Séquence 7 : restructurer et nettoyer ses tableaux
- Restructurer ses tableaux (passer du format large à long) avec le package tidyr
- Nettoyer une chaine de caractère (package stringr) et organiser l’ordre des facteurs (package forcats)

Réactivation mémoire et cartographie des connaissances et cartographie des connaissances communes (carte mentale avec le logiciel xmind)


Pré-requis :
Apporter son ordinateur

Les instructions pour l’installation des logiciels et packages, les données qui servent de support pour la formation, le pdf à imprimer contenant le code de la formation (hors exercices) et servant à prendre des notes, ainsi que le document Rmarkdown servant de modèle pour taper le code lors de la formation sont envoyés à chaque participant- e quelques jours avant la formation. Les personnes en situation de handicap peuvent me contacter pour que nous puissions adapter la formation à leurs besoins.



Méthode pédagogique :
La formation utilise l’interface conviviale de RStudio, qui facilite l’utilisation de R, et le package Rmarkdown, qui permet de générer automatiquement des rapports (html,word, pdf) à partir du code. La méthode pédagogique consiste en un enchaînement de séquences progressives constituées d’une démonstration (apport théorique), suivie d’un quiz puis d’un exercice d’application. A cela s’ajoute une méthode pédagogique conçue pour les débutant-e-s et consistant à dédoubler la séquence de démonstration de la manière suivante :
• Une première démonstration, pendant lequel le formateur présente les connaissances et compétences à acquérir en tapant le code, pendant que les participant-e-s, sans taper le code, concentrent leur attention sur la compréhension des informations, les questions et la prise de note sur le document pdf envoyé en amont et à imprimer et contenant le code tapé par le formateur (ce qui facilite grandement la prise de notes).
• Une deuxième démonstration, pendant lequel le code est retapé cette fois-ci tous ensemble, afin que les participant-e-s pratiquent et fassent des erreurs corrigées par le formateur.

Cette méthode est utilisée le premier jour, la démonstration ne se faisant ensuite qu’en un seul temps une fois les participant-e-s à l’aise avec le langage et sa syntaxe. Cette méthode est très adaptée aux formations à des outils informatiques, qui sont la plupart du temps basées sur le faire ensemble (le formateur montre pas à pas l’enchaînement des opérations à accomplir) et dans lesquelles les participants sont très vite dépassés par la nécessité de faire plusieurs taches simultanément : regarder le tableau pour voir les opérations tapées par le formateur, regarder ensuite son écran pour les taper, écouter les explications du formateur, prendre des notes, corriger ses erreurs. Ce mélange des taches entraîne une forte diminution de la capacité d’écoute et de compréhension des apprenants, et une forte diminution de l’efficacité pédagogique de la formation.

Evaluations de la formation :
- autoévaluation individuelle de l’atteinte des objectifs (graphiques de réussite aux quiz et exercices)
- évaluation de satisfaction de la formation (questionnaire en ligne)





Compétences acquises à l'issue de la formation :
A l’issue la formation, les participant-e-s seront capable de :
• Installer R et RStudio, installer un package, utiliser les quatre fenêtres de RStudio, créer des vecteurs numériques et de caractères et des tableaux de données
• Charger un tableau de données, vérifier et déclarer les types des variables (facteur, date)
• Effectuer les manipulation de données les plus courantes: filtrer des lignes, sélectionner des colonnes, faire des opérations (moyennes, écart-types) groupées selon certaines conditions (modalités, traitements, année, etc.), rajouter des colonnes, faire un calcul entre colonnes
• Améliorer l’esthétique des graphiques pour la publication (couleurs, axes, police, légendes)
• Fusionner des tableaux de tailles différentes
• Restructurer et nettoyer les tableaux (corriger des chaînes de caractères, réorganiser les niveaux d'un facteur)
• Générer avec Rmarkdown un rapport html à partir du code

Les Compétences et capacités visées à l'issue de la formation (fiches RNCP)

Arrêté du 22 février 2019 définissant les compétences des diplômés du doctorat et inscrivant le doctorat au répertoire national de la certification professionnelle. https://www.legifrance.gouv.fr/loda/id/JORFTEXT000038200990/

Bloc 1 : Conception et élaboration d’une démarche de recherche et développement, d’études et prospective

- Disposer d'une expertise scientifique tant générale que spécifique d'un domaine de recherche et de travail déterminé

- Identifier et résoudre des problèmes complexes et nouveaux impliquant une pluralité de domaines, en mobilisant les connaissances et les savoir-faire les plus avancés

Compétences sociales

- Adaptation ; Persévérance ; Résilience ; Gestion du changement et de l'échec ; Engagement


La formation participe à l'objectif suivant :être directement utile pour la réalisation des travaux personnels de recherche

Calendrier :

Séance n° 1
Date : 26-05-2026
Horaire : 09h00 à 12h30
Intervenant : Oswaldo Forey
Lieu : Salle 1 du Collège Doctoral Bâtiment 3 Campus Triolet

Séance n° 2
Date : 26-05-2026
Horaire : 13h30 à 17h00
Intervenant : Oswaldo Forey
Lieu : Salle 1 du Collège Doctoral Bâtiment 3 Campus Triolet

Séance n° 3
Date : 27-05-2026
Horaire : 09h00 à 12h30
Intervenant : Oswaldo Forey
Lieu : Salle 1 du Collège Doctoral Bâtiment 3 Campus Triolet

Séance n° 4
Date : 27-05-2026
Horaire : 13h30 à 17h00
Intervenant : Oswaldo Forey
Lieu : Salle 1 du Collège Doctoral Bâtiment 3 Campus Triolet


Inscription au cours




Retour à la liste