Français Anglais
Collège Doctoral
Retour à la liste

Parcours CEDRE 2 - Prétraitement des données de la recherche : techniques pratiques pour la gestion efficace des données [Participation : Présentiel]

Contact : Direction de la Formation Doctorale AMU
Anne-Francoise.Lhote@univ-amu.fr

Catégorie : Outils de la thèse - Formations scientifiques

Thématique : Formation à la recherche 

Langue de l'intervention : français

Nombre d'heures : 12h

Min participants : 2

Max participants : 20

Nbre d'inscrits : 17

Nombre de places disponibles : 3

Public prioritaire : Aucun

Public concerné :
Doctorant(e)s

Proposé par : Aix Marseille Université


Lieu : Voir Calendrier
Observations : Ce module constitue l’étape 2 du parcours CEDRE.
Ce parcours comprend :
le module 1 de programmation avec Python orientée analyse des données,
ce module 2 dédié au Prétraitement des données,
le module 3 dédié au Machine Learning
le module 4 dédié au Deep Learning.
Préinscriptions séparées dans ADUM.

Vous pouvez suivre l’intégralité du parcours ou bien des modules ponctuels au regard de vos compétences actuelles, mentionnées dans les prérequis.

Mots clés : Bases de données, SQL, Python, visualisation, Data Viz
Début de la formation : 4 décembre 2025
Fin de la formation : 5 décembre 2025
Date ouverture des inscriptions : 3 novembre 2025
Date fermeture des inscriptions : 1 décembre 2025

Objectifs :
• Introduire le prétraitement et la préparation des données de recherche pour une analyse avancée.
• Collection et extraction d’informations pertinentes provenant des différentes sources/bases de données.
• Intégration, traitement et exploitation des bases de données à travers langage SQL.
• Introduction à l’utilisation de librairies Python.
• Rappel des concepts statistiques fondamentaux.
• Création des visualisations avec l’objectif d’une publication scientifique.
• Automatisation des processus répétitifs.

Programme :
1. Introduction au prétraitement des données dans la recherche.
2. Présentation des étapes du prétraitement des données.
3. Modélisation des bases de données. Types de Bases de Données : Systèmes de gestion. Modèle conceptuel des données.
4. Bases de données relationnelles. Introduction au langage SQL. Fondamentaux des requêtes SQL. Opérations CRUD (anglicisme pour Create, Read, Update and Delete) et jointures.
5. Librairies Python pour le prétraitement des données (pandas et numpy). Récupération et lecture des fichiers. Manipulation de Data-frame. Indexation, sélection et assignation.
6. Les outils pour la statistique descriptive
7. Outils/librairies Python pour la visualisation des données.
8. Réduction de dimensionnalité P1: transformation des caractéristiques.

Impératif : votre ordinateur personnel doit être préalablement équipé d'Anaconda (https://www.anaconda.com/)

Pré-requis :
• Impératif :
- venir à cette formation avec votre ordinateur personnel
- il doit être préalablement équipé d'Anaconda (https://www.anaconda.com/).
• Bases de programmation (Python).


Equipe pédagogique :
Equipe : CEntre de Formation et de Soutien aux Données de la REcherche (CEDRE) - programme 2 du projet IDeAL, rattaché à la DIRNUM

Méthode pédagogique :
Cette formation repose sur une approche pédagogique centrée sur la pratique, intégrant les Notebooks Jupyter comme principal outil d'enseignement et d'apprentissage.

Les apprenants sont guidés à travers des exemples concrets et interactifs de code, qu'ils peuvent exécuter et modifier en temps réel, ce qui permet d'allier théorie et pratique. Cela favorise :
• L'apprentissage par l’expérimentation : Chaque concept est accompagné d’exercices pratiques que les doctorants peuvent manipuler, tester et adapter à leurs propres besoins de recherche.
• L’autonomie dans l'apprentissage : Les participants peuvent revenir sur les notebooks, refaire les exercices et approfondir les notions à leur rythme.
• Résolution de problèmes réels : Des études de cas, basées sur des problématiques de recherche, sont intégrées pour familiariser les participants avec l'application des méthodes d'analyse des données dans divers domaines scientifiques.

Tout au long de la session, nous vous encourageons à poser des questions. Ces moments permettent d'aborder des problèmes spécifiques et de renforcer la compréhension collective.


Compétences acquises à l'issue de la formation :
• Identifier les différents types de systèmes de gestion de base de données
• Identifier la structure d’une base de données relationnelle ou non relationnelle
• Extraire l’information relevant d’une base de données
• Créer et lire un Modèle Conceptuel de Données.
• Lire, écrire et modifier du contenu dans une base de données avec SQL
• Manipuler des BDD provenant de différentes sources
• Tracer des courbes ou d’autres types de graphique en partant d’une base de données
• Faire une analyse statistique
• Nettoyer des bases de données
• Faire des visualisations pour mieux communiquer ses observations
• Appliquer des techniques de prétraitement des données dans la recherche.

Les Compétences et capacités visées à l'issue de la formation (fiches RNCP)

Arrêté du 22 février 2019 définissant les compétences des diplômés du doctorat et inscrivant le doctorat au répertoire national de la certification professionnelle. https://www.legifrance.gouv.fr/loda/id/JORFTEXT000038200990/

Bloc 1 : Conception et élaboration d’une démarche de recherche et développement, d’études et prospective

- Disposer d'une expertise scientifique tant générale que spécifique d'un domaine de recherche et de travail déterminé

- Faire le point sur l’état et les limites des savoirs au sein d’un secteur d’activité déterminé, aux échelles locale, nationale ou internationale

- Identifier et résoudre des problèmes complexes et nouveaux impliquant une pluralité de domaines, en mobilisant les connaissances et les savoir-faire les plus avancés

- Identifier les possibilités de ruptures conceptuelles et concevoir des axes d’innovation pour un secteur professionnel

- Apporter des contributions novatrices dans le cadre d’échanges de haut niveau, et dans des contextes internationaux

- S’adapter en permanence aux nécessités de recherche et d’innovation au sein d’un secteur professionnel

Bloc 2 : Mise en œuvre d’une démarche de recherche et développement, d’études et prospective

- Mettre en œuvre les méthodes et les outils de la recherche en lien avec l’innovation

Bloc 4 : Veille scientifique et technologique à l’échelle internationale

- Acquérir, synthétiser et analyser les données et informations scientifiques et technologiques d’avant-garde à l’échelle internationale

- Disposer d’une compréhension, d’un recul et d’un regard critique sur l’ensemble des informations de pointe disponibles

- Dépasser les frontières des données et du savoir disponibles par croisement avec différents champs de la connaissance ou autres secteurs professionnels

- Disposer de la curiosité, de l’adaptabilité et de l’ouverture nécessaire pour se former et entretenir une culture générale de haut niveau

Bloc 5 : Formation et diffusion de la culture scientifique et technique

- Rendre compte et communiquer en plusieurs langues des travaux à caractère scientifique et technologique en direction de publics ou publications différents, à l’écrit comme à l’oral

Compétences sociales

- Adaptation ; Persévérance ; Résilience ; Gestion du changement et de l'échec ; Engagement

- Créativité, capacité à imaginer et formuler des idées originales ; Souplesse d'esprit et ouverture à la nouveauté

- Indépendance ; Autonomie ; Esprit d'initiative et prise de décision


La formation participe à l'objectif suivant :être directement utile pour la réalisation des travaux personnels de recherche

Calendrier :

Séance n° 1
Date : 04-12-2025
Horaire : 09h00-12h00 et 13h00-16h00
Intervenant : Équipe Projet CEDRE
Lieu : Marseille, Campus St Charles, salle 15-513

Séance n° 2
Date : 05-12-2025



Retour à la liste