Français Anglais
Université de Bordeaux
Retour à la liste

Going further with R: good practices for data analysis and writing a reproducible article [Participation : Présentiel]

Contact : Benchebaat Dalila
formationdoctorat@u-bordeaux.fr
Tél: 05 40 00 24 97

Catégorie : 2. Mener à bien ses activités de recherche

Thématique : Formation à la recherche 

Langue de l'intervention : français et anglais

Nombre d'heures : 15

Min participants : 8

Max participants : 20

Nombre de places disponibles : 20

Public prioritaire : Aucun

Public concerné :
Tout doctorant de Université de Bordeaux

Proposé par : Collège doctoral Université de Bordeaux


Lieu : A venir
Observations : - Each PhD student will have to install R, Rstudio, Quarto (if possible in their latest versions) and a complete LaTeX distribution (such as TeXLive or MikTeX) on their personal computer before the first session. - For any questions related to accessibility or specific needs, please contact: formationdoctorat@u-bordeaux.fr.
Mots clés : R, literate programming, reproducible research, data analysis, statistics, quarto
Début de la formation : 21 avril 2026
Fin de la formation : 29 avril 2026
Date ouverture des inscriptions : 1 février 2026
Date fermeture des inscriptions : 12 avril 2026

Objectifs :
Using R for data analysis efficiently, and discovering a set of useful R packages. Using R and Quarto to write a reproducible research paper.
Note that this teaching unit is more geared towards good pratices in R programming (in a broad sense) than towards advanced statistical methods, or statistical theory per se.
Another, distinct teaching unit is proposed to that end.

Programme :
1) Good practices for R programming and reproducible research
Using Quarto notebooks instead of R scripts, using Quarto templates to write a research article and export it to a PDF, controlling the R environment (by setting packages versions, etc.) for a better reproducibility, discovering some basic features of Git for versionning scripts, managing bibliographical references through Rstudio.

2) Cleaning, reshaping and summarising data
Using a set of packages (mainly from the ‘tidyverse’) to import, check, reshape and summarise data easily.

3) Producing advanced, publication-ready plots
Using {ggplot2} and several of its natural extensions to create elegant and informative figures.

4) Easier modeling and iterations through the ‘tidyverse’
Depending on the interests of the audience, some more advanced topics could be addressed during the last half-day, such as:
- Using for getting better summaries and more structured information from your models
- Using for producing automatically a large number of models or plots
- Using {FactoMineR} & friends to do exploratory multivariate analyses (PCA, clustering, etc.).


Pré-requis :
- Having completed the “Introduction to R: from the basics to the first steps of data manipulation and representation” teaching unit, proposed by the Graduate Research Shgool of the University of Bordeaux.
- Otherwise, at least a very basic knowledge of the R langage is required (this teaching unit is not a general introduction to R for newcomers).
- Regarding Quarto, no previous knowledge is required.


Equipe pédagogique :
Frédéric Santos, ingénieur d’études en statistiques, laboratoire « De la Préhistoire à l'Actuel : Culture, Environnement et Anthropologie » (PACEA)-UMR 5199, Centre national de la recherche scientifique (CNRS), Université de Bordeaux

Méthode pédagogique :
All the “theoretical” content will be available on a dedicated website.
The practical part will consist in replicating exactly the PDF of a (fictive but credible!) research article, provided by the teacher (along with the corresponding dataset). To this end, PhD students will have to use both R programming (to reproduce the results, tables and figures) and Quarto (for composing the final PDF).
This format will allow each PhD student to progress with relative autonomy, at a pace that suits them.


Compétences acquises à l'issue de la formation :
- Develop a transparent and reproducible workflow for data analysis
- Discovering best practices for an efficient R programming
- Using literate programming (Quarto) for writing a research article


Les Compétences et capacités visées à l'issue de la formation (fiches RNCP)

Arrêté du 22 février 2019 définissant les compétences des diplômés du doctorat et inscrivant le doctorat au répertoire national de la certification professionnelle. https://www.legifrance.gouv.fr/loda/id/JORFTEXT000038200990/

Bloc 2 : Mise en œuvre d’une démarche de recherche et développement, d’études et prospective

- Mettre en œuvre les méthodes et les outils de la recherche en lien avec l’innovation


Calendrier :

Séance n° 1
Date : 21-04-2026
Horaire : 13h30-17h30
Intervenant : Frédéric Santos, ingénieur d’études en statistiques, laboratoire
Lieu : A venir

Séance n° 2
Date : 22-04-2026
Horaire : 08h30-17h00
Intervenant : Frédéric Santos, ingénieur d’études en statistiques, laboratoire
Lieu : A venir

Séance n° 3
Date : 29-04-2026
Horaire : 13h30-17h30
Intervenant : Frédéric Santos, ingénieur d’études en statistiques, laboratoire
Lieu : A venir


Inscription non encore ouverte, vous pourrez vous inscrire ultérieurement




Retour à la liste