Retour à la liste

Analyse de données avec le logiciel R [Participation : Présentiel]

Contact : Fremaux Amandine
formations-college-doctoral@univ-lille.fr
Tél: 03.20.79.87.18

Catégorie : Formations numériques

Langue de l'intervention : français

Nombre d'heures : 35

Crédits/Points : 15

Min participants : 6

Max participants : 12

Nombre de places disponibles : 12

Public prioritaire : Aucun

Public concerné :
Doctorant(e)s

Proposé par :


Mots clés : Formation numérique / Logiciel
Début de la formation : 24 mars 2026
Fin de la formation : 10 avril 2026
Date ouverture des inscriptions : 24 décembre 2025
Date fermeture des inscriptions : 18 mars 2026

Objectifs :
Savoir réaliser des analyses de données à l’aide du logiciel R et savoir interpréter les résultats.



Programme :
Module 1 →
- Introduction générale : présentation du logiciel R et de sa documentation, installation de R.
- Les bases d’utilisation du logiciel : importation et exportation des données, manipulation de données.
- Statistiques descriptives et estimation : représentations graphiques, intervalles de confiance, tests statistiques usuels.

Module 2 →
- Correction du mini-projet sur les statistiques descriptives et tests (sujet donné à la fin du module 1).
- Corrélation et régression linéaire simple. ANOVA. Régres-
sion linéaire multiple.
- Initiation à la classification : classification ascendante hiérarchique, K-means, régression logistique.
- Introduction au package ggplot2 (visualisation des données).

Module 3 →
• Correction du mini-projet donné après le module 2
• Synthèse

Pré-requis :
Connaître les bases de statistique : probabilités, statistique descriptive, inférence statistique (intervalles de confiance, théorie des tests statistiques), analyses de liaison entre deux variables.
Doctorants ayant suivi des cours de statistique appliquée mais non spécialistes en mathématiques.


Equipe pédagogique :
Evgenia BABYKINA, Maîtres de Conférences en Biostatistique à l’Université de Lille. Cyrielle Dumont, Maîtres de Conférences en Biostatistique à l’Université de Lille

Méthode pédagogique :
Le cycle de formation est constitué de 3 modules sur 5 journées entières. Il est indispensable de s’inscrire et de venir à l'intégralité du cycle car les modules sont dépendants les uns des autres. Des mini-projets appliqués feront le lien entre les différents modules.

Compétences acquises à l'issue de la formation :
À l’issue de la formation, un∙e doctorant∙e saura : Importer les données en R, les exporter et formater. Réaliser les statistiques descriptives (répresentations graphiques, indicateurs numériques). Réaliser les statistiques inférentielles (intervalles de confiance, test usuels). Le/la doctorant∙e aura été initié∙e aux analyses multivariées (régression linéaire multiple, régression logistique, k-means, classification ascendante hiérarchique).

Les Compétences et capacités visées à l'issue de la formation (fiches RNCP)

Arrêté du 22 février 2019 définissant les compétences des diplômés du doctorat et inscrivant le doctorat au répertoire national de la certification professionnelle. https://www.legifrance.gouv.fr/loda/id/JORFTEXT000038200990/

Bloc 2 : Mise en œuvre d’une démarche de recherche et développement, d’études et prospective

- Mettre en œuvre les méthodes et les outils de la recherche en lien avec l’innovation

Bloc 4 : Veille scientifique et technologique à l’échelle internationale

- Acquérir, synthétiser et analyser les données et informations scientifiques et technologiques d’avant-garde à l’échelle internationale

- Dépasser les frontières des données et du savoir disponibles par croisement avec différents champs de la connaissance ou autres secteurs professionnels


La formation participe à l'objectif suivant :être directement utile pour la réalisation des travaux personnels de recherche

Calendrier :

Séance n° 1
Date : 24-03-2026
Horaire : 09h00 à 17h00
Intervenant : Cyrielle Dumont
Lieu : Université de Lille, Campus Flers-Château
Intitulé cours : Jour 1: Analyse de données avec le logiciel R
Info diverses : Formation dispensée exclusivement en français et en présentiel

Séance n° 2
Date : 27-03-2026
Horaire : 09h00 à 17h00
Intervenant : Cyrielle Dumont
Lieu : Université de Lille, Campus Flers-Château
Intitulé cours : Jour 2: Analyse de données avec le logiciel R
Info diverses : Formation dispensée exclusivement en français et en présentiel

Séance n° 3
Date : 30-03-2026
Horaire : 09h00 à 17h00
Intervenant : Evgeniya Babykina
Lieu : Université de Lille, Campus Flers-Château
Intitulé cours : Jour 3: Analyse de données avec le logiciel R
Info diverses : Formation dispensée exclusivement en français et en présentiel

Séance n° 4
Date : 02-04-2026
Horaire : 09h00 à 17h00
Intervenant : Evgeniya Babykina
Lieu : Université de Lille, Campus Flers-Château
Intitulé cours : Jour 4: Analyse de données avec le logiciel R
Info diverses : Formation dispensée exclusivement en français et en présentiel

Séance n° 5
Date : 10-04-2026
Horaire : 09h00 à 17h00
Intervenant : Evgeniya Babykina
Lieu : Université de Lille, Campus Flers-Château
Intitulé cours : Jour 5: Analyse de données avec le logiciel R
Info diverses : Formation dispensée exclusivement en français et en présentiel


Inscription non encore ouverte, vous pourrez vous inscrire ultérieurement




Retour à la liste