Contact : Collège Doctoral de l'Université de Montpellier formations-college@umontpellier.fr
Catégorie : Outils transverses
Langue de l'intervention : français
Nombre d'heures : 14
Min participants : 5
Max participants : 15
Nbre d'inscrits : 15
Nombre de places disponibles : 0
Public prioritaire : Aucun
Public concerné : Doctorant(e)s
Proposé par : Collège Doctoral Université de Montpellier
| Lieu : Salle du Collège Doctoral Campus Triolet Bat 3 Observations : Les instructions pour l’installation des logiciels et packages, les données qui servent de support pour la formation, le pdf à imprimer contenant le code de la formation (hors exercices) et servant à prendre des notes, ainsi que le document Rmarkdown servant de modèle pour taper le code lors de la formation sont envoyés à chaque participant-e une semaine avant la formation.
Les personnes en situation de handicap peuvent contacter le formateur afin de trouver ensemble comment adapter la formation pour répondre à leurs besoins.
Mots clés : Rstudio, Tidyverse, Rmarkdown Début de la formation : 29 septembre 2025 Fin de la formation : 30 septembre 2025 Date ouverture des inscriptions : Date fermeture des inscriptions : 22 septembre 2025 Modalités d'inscription : Via Adum puis un tableau de conformité aux pré-requis a remplir en ligne vous sera envoyé par le formateur Objectifs : L’objectif de la formation est d’acquérir les bases de Rstudio, du Tidyverse et de Rmarkdown, pour la manipulation de tableaux, la production de graphiques et la production de rapports.
Cette formation se concentre sur les étapes de l’analyse de données en amont de l’analyse statistique et est basée sur le package et langage Tidyverse, conçu spécifiquement pour la manipulation de données et la production de graphiques. Programme : JOUR 1
Séquence 1 : RStudio, bases de R et Rmarkdown
- L’interface RStudio: les 4 fenêtres, les menus déroulants
- La création d’objet et l’assignation, les fonctions, les classes (vecteurs numériques, vecteurs de caractères, dataframe) d’objets et les types de variables (facteur, date)
- Création et utilisation d’un document Rmarkdown
Séquence 2 : la syntaxe du Tidyverse
- La syntaxe d’un graphique avec le package ggplot2
- La syntaxe de la manipulation de tableaux et la manipulation de colonnes avec le package dplyr
Séquence 3 : vision d’ensemble de la chaine du traitement de données
- Importer ses données, visualiser les données brutes, modifier le type des variables, transformer les données (calculs de moyennes, sélection de lignes), visualiser les données transformées
Séquence 4 : les tableaux de données à nombreuses variables
- Opérations conditionnelles, gestion des données manquantes
- Représentation de combinaisons de variables sur le même graphique, représentation des écart-types
JOUR 2
Séquence 5 : l’amélioration des graphiques
- Les 4 types de calques de ggplot2 et les différents types de modification (couleurs, axes, légendes, polices)
Séquence 6 : fusion de tableaux
- Les deux manières essentielles de joindre des tableaux (collés et fusionnés)
Séquence 7 : restructurer et nettoyer ses tableaux
- Restructurer ses tableaux (passer du format large à long) avec le package tidyr
- Nettoyer une chaine de caractère (package stringr) et organiser l’ordre des facteurs (package forcats)
Réactivation mémoire et cartographie des connaissances
- Réactivation mémoire individuelle des connaissances acquises et cartographie des connaissances communes (carte mentale avec le logiciel xmind)
Evaluations de la formation :
- autoévaluation individuelle de l’atteinte des objectifs (graphiques de réussite aux quiz et exercices)
- évaluation de satisfaction de la formation (questionnaire en ligne)
Pré-requis : INSCRIPTION : Via Adum puis un tableau de conformité aux pré-requis a remplir en ligne vous sera envoyé par le formateur
Méthode pédagogique : La formation utilise l’interface conviviale de RStudio, qui facilite l’utilisation de R et le format de fichiers Rmarkdown, qui permet de générer automatiquement des rapports (html,word, pdf ou même des diaporamas) à partir du code.
La méthode pédagogique consiste en un enchainement de séquences progressives constituées d’une démonstration (apport théorique), suivie d’un quiz puis d’un exercice et mobilise des acquis des sciences cognitives en matière d’apprentissage pour renforcer la mémorisation.
A cela s’ajoute une méthode pédagogique conçue pour les débutant-e-s et consistant à dédoubler la séquence de démonstration de la manière suivante :
• Une première démonstration, pendant lequel le formateur présente les connaissances et compétences à acquérir en tapant le code, pendant que les participant-e-s, sans taper le code, concentrent leur attention sur la compréhension des informations, les questions et la prise de note sur le document pdf envoyé en amont et à imprimer et contenant le code tapé par le formateur (ce qui facilite grandement la prise de notes).
• Une deuxième démonstration, pendant lequel le code est retapé cette fois-ci tous ensemble, afin que les participant-e-s pratiquent et fassent des erreurs corrigées par le formateur.
Cette méthode est utilisée le premier jour, la démonstration ne se faisant ensuite qu’en un seul temps une fois les participant-e-s à l’aise avec le langage et sa syntaxe.
Cette méthode est très adaptée aux formations à des outils informatiques, qui sont la plupart du temps basées sur le faire ensemble (le formateur montre pas à pas l’enchaînement des opérations à accomplir) et dans lesquelles les participants sont très vite dépassés par la nécessité de faire plusieurs taches simultanément : regarder le tableau pour voir les opérations tapées par le formateur, regarder ensuite son écran pour les taper, écouter les explications du formateur, prendre des notes, corriger ses erreurs.
Ce mélange des taches entraîne une forte diminution de la capacité d’écoute et de compréhension des apprenants, et une forte diminution de l’efficacité pédagogique de la formation.
Compétences acquises à l'issue de la formation : • A l’issu la formation, les participant-e-s seront capable de :
• Installer R et RStudio, installer un package, utiliser les quatre fenêtres de RStudio, créer des vecteurs numériques et de caractères et des tableaux de données
• Charger un tableau de données, vérifier et déclarer les types des variables (facteur, date)
• Effectuer les manipulations de données les plus courantes: filtrer des lignes, sélectionner des colonnes, faire des opérations (moyennes, écart-types) groupées selon certaines conditions (modalités, traitements, année, etc.), rajouter des colonnes, faire un calcul entre colonnes
• Améliorer l’esthétique des graphiques pour la publication (couleurs, axes, police, légendes)
• Fusionner des tableaux de tailles différentes
• Restructurer et nettoyer les tableaux (corriger des chaines de caractères, réorganiser les niveaux d'un facteur)
• Générer avec Rmarkdown un rapport html à partir du code
Les Compétences et capacités visées à l'issue de la formation (fiches RNCP)
Arrêté du 22 février 2019 définissant les compétences des diplômés du doctorat et inscrivant le doctorat au répertoire national de la certification professionnelle. https://www.legifrance.gouv.fr/loda/id/JORFTEXT000038200990/ Bloc 1 : Conception et élaboration d’une démarche de recherche et développement, d’études et prospective - Disposer d'une expertise scientifique tant générale que spécifique d'un domaine de recherche et de travail déterminé - Identifier et résoudre des problèmes complexes et nouveaux impliquant une pluralité de domaines, en mobilisant les connaissances et les savoir-faire les plus avancés Bloc 4 : Veille scientifique et technologique à l’échelle internationale - Acquérir, synthétiser et analyser les données et informations scientifiques et technologiques d’avant-garde à l’échelle internationale La formation participe à l'objectif suivant :être directement utile pour la réalisation des travaux personnels de recherche
Calendrier :
Séance n° 1 Date : 29-09-2025 Horaire : 09h00 à 12h30 Intervenant : Oswaldo Forey Lieu : Salle du Collège Doctoral Bâtiment 3 Campus Triolet
Séance n° 2 Date : 29-09-2025 Horaire : 13h30 à 17h00 Intervenant : Oswaldo Forey Lieu : Salle du Collège Doctoral Bâtiment 3 Campus Triolet
Séance n° 3 Date : 30-09-2025 Horaire : 09h00 à 12h30 Intervenant : Oswaldo Forey Lieu : Salle du Collège Doctoral Bâtiment 3 Campus Triolet
Séance n° 4 Date : 30-09-2025 Horaire : 13h30 à 17h00 Intervenant : Oswaldo Forey Lieu : Salle du Collège Doctoral Bâtiment 3 Campus Triolet
|