Français Anglais
Collège Doctoral
Retour à la liste

Parcours CEDRE 3 - Analyse des données de la recherche : introduction à l’Intelligence Artificielle par Apprentissage Automatique (Machine Learning) [Participation : Présentiel]

Contact : Direction de la Formation Doctorale AMU
Anne-Francoise.Lhote@univ-amu.fr

Catégorie : Outils de la thèse - Formations scientifiques

Thématique : Formation à la recherche 

Langue de l'intervention : français

Nombre d'heures : 18h

Min participants : 2

Max participants : 20

Nbre d'inscrits : 11

Nombre de places disponibles : 9

Public prioritaire : Aucun

Public concerné :
Doctorant(e)s

Proposé par : Aix Marseille Université


Observations : Ce module constitue l'étape 3 du parcours CEDRE.
Le parcours comprend :
le module 1 de programmation avec Python orientée analyse des données,
le module 2 dédié au Prétraitement des données,
ce module 3 dédié au Machine Learning
le module 4 dédié au Deep Learning.
Préinscriptions séparées dans ADUM.

Vous pouvez suivre l’intégralité du parcours ou bien des modules ponctuels au regard de vos compétences actuelles, mentionnées dans les prérequis.

Mots clés : Python, Données, Machine Learning
Début de la formation : 8 décembre 2025
Fin de la formation : 10 décembre 2025
Date ouverture des inscriptions : 3 novembre 2025
Date fermeture des inscriptions : 3 décembre 2025

Objectifs :
• Relier les concepts d’analyse de données, Intelligence Artificielle -IA- et Apprentissage Automatique (Machine Learning-ML-).
• Identifier les types d’apprentissage (supervisé, non supervisé et par renforcement) et leurs algorithmes associés.
• Introduction à l’utilisation des librairies spécialisées de Python : Scikit-Learn.
• Identifier et mettre en œuvre les étapes de l’Apprentissage Automatique.
• Conduire un projet d’Apprentissage Automatique dans son intégralité.
• Construire une compréhension de l’analyse avancée de données à travers une technique de l’Intelligence Artificielle.

Programme :
1. L’Intelligence Artificielle : les concepts.
2. Rappel de prétraitement de données et réduction de dimensionalité P2: sélection des caractéristiques.
3. Processus du ML : collecte de données, nettoyage et analyse de données, mélange et séparation de données, apprentissage, modèles et hyperparamètres, entraînement d’un modèle, validation, exploitation, optimisation d’un modèle.
4. Concepts de ML, algorithmes supervisés et non supervisés. Mesures de la qualité : accuracy, precision, recall, F1 score, R2, MSE. Sur-apprentissage et Sous-apprentissage.
5. Régression linéaire et algorithmes de la librairie Scikit Learn
6. Classification et algorithmes de la librairie Scikit Learn : k-NN pour classification, machine à vecteurs supports, classification Bayésienne naïve, régression logistique, etc.
7. Clustering et Scikit Learn: k means, hiérarchique.

Pré-requis :
• IMPÉRATIF :
- venir à cette formation avec votre ordinateur personnel
- il doit être préalablement équipé d'Anaconda (https://www.anaconda.com/).
• Solide compréhension du langage de programmation Python et connaissances du Machine Learning, ou avoir suivi les modules Parcours CEDRE 1 et 2.

Equipe pédagogique :
Equipe : CEntre de Formation et de Soutien aux Données de la REcherche (CEDRE) - programme 2 du projet IDeAL, rattaché à la DIRNUM

Méthode pédagogique :
Cette formation repose sur une approche pédagogique centrée sur la pratique, intégrant les Notebooks Jupyter comme principal outil d'enseignement et d'apprentissage.

Les apprenants sont guidés à travers des exemples concrets et interactifs de code, qu'ils peuvent exécuter et modifier en temps réel, ce qui permet d'allier théorie et pratique. Cela favorise :
• L'apprentissage par l’expérimentation : Chaque concept est accompagné d’exercices pratiques que les doctorants peuvent manipuler, tester et adapter à leurs propres besoins de recherche.
• L’autonomie dans l'apprentissage : Les participants peuvent revenir sur les notebooks, refaire les exercices et approfondir les notions à leur rythme.
• Résolution de problèmes réels : Des études de cas, basées sur des problématiques de recherche, sont intégrées pour familiariser les participants avec l'application des méthodes d'analyse des données dans divers domaines scientifiques.

Tout au long de la session, nous vous encourageons à poser des questions. Ces moments permettent d'aborder des problèmes spécifiques et de renforcer la compréhension collective.


Compétences acquises à l'issue de la formation :
• Comprendre les concepts liés à l’IA.
• Différencier Apprentissage Automatique (Machine Learning - ML) et Apprentissage Profond (Deep Learning).
• Utiliser le vocabulaire technique de ML.
• Connaître la méthode pour développer ses propres algorithmes de ML.
• Savoir expliquer et utiliser les différents algorithmes de ML.
• Mettre en œuvre les processus pour résoudre des problèmes métier à travers le ML.
• Collecter des données et les utiliser avec Python.
• Analyser statistiquement une base de données avec Python.
• Communiquer des observations simples grâce à travers des graphiques et des modules spécialisés.
• Identifier les variables dans une base de données.
• Transformer les variables pour leur utilisation dans un modèle mathématique.
• Être en mesure de trier les données et d’expliquer ses décisions.
• Entraîner des modèles de ML.
• Modifier les modèles (régler les hyperparamètres) pour améliorer ses performances.
• Mesurer la performance du modèle selon le type de problème.
• Optimiser ses modèles.


Les Compétences et capacités visées à l'issue de la formation (fiches RNCP)

Arrêté du 22 février 2019 définissant les compétences des diplômés du doctorat et inscrivant le doctorat au répertoire national de la certification professionnelle. https://www.legifrance.gouv.fr/loda/id/JORFTEXT000038200990/

Bloc 1 : Conception et élaboration d’une démarche de recherche et développement, d’études et prospective

- Disposer d'une expertise scientifique tant générale que spécifique d'un domaine de recherche et de travail déterminé

- Faire le point sur l’état et les limites des savoirs au sein d’un secteur d’activité déterminé, aux échelles locale, nationale ou internationale

- Identifier et résoudre des problèmes complexes et nouveaux impliquant une pluralité de domaines, en mobilisant les connaissances et les savoir-faire les plus avancés

- Identifier les possibilités de ruptures conceptuelles et concevoir des axes d’innovation pour un secteur professionnel

- Apporter des contributions novatrices dans le cadre d’échanges de haut niveau, et dans des contextes internationaux

- S’adapter en permanence aux nécessités de recherche et d’innovation au sein d’un secteur professionnel

Bloc 2 : Mise en œuvre d’une démarche de recherche et développement, d’études et prospective

- Mettre en œuvre les méthodes et les outils de la recherche en lien avec l’innovation

- Mettre en œuvre les facteurs d’engagement, de gestion des risques et d’autonomie nécessaire à la finalisation d’un projet R&D, d’études ou d’innovation

Bloc 3 : Valorisation et transfert des résultats d’une démarche R&D, d’études et prospective

- Mettre en œuvre les problématiques de transfert à des fins d’exploitation et valorisation des résultats ou des produits dans des secteurs économiques ou sociaux

- Mettre en œuvre l’ensemble des dispositifs de publication à l’échelle internationale permettant de valoriser les savoirs et connaissances nouvelles

- Mobiliser les techniques de communication de données en « open data » pour valoriser des démarches et résultats

Bloc 4 : Veille scientifique et technologique à l’échelle internationale

- Acquérir, synthétiser et analyser les données et informations scientifiques et technologiques d’avant-garde à l’échelle internationale

- Disposer d’une compréhension, d’un recul et d’un regard critique sur l’ensemble des informations de pointe disponibles

- Dépasser les frontières des données et du savoir disponibles par croisement avec différents champs de la connaissance ou autres secteurs professionnels

- Développer des réseaux de coopération scientifiques et professionnels à l’échelle internationale

- Disposer de la curiosité, de l’adaptabilité et de l’ouverture nécessaire pour se former et entretenir une culture générale de haut niveau

Bloc 5 : Formation et diffusion de la culture scientifique et technique

- Rendre compte et communiquer en plusieurs langues des travaux à caractère scientifique et technologique en direction de publics ou publications différents, à l’écrit comme à l’oral

- S’adapter à un public varié pour communiquer et promouvoir des concepts et démarches d’avant-garde

Compétences sociales

- Adaptation ; Persévérance ; Résilience ; Gestion du changement et de l'échec ; Engagement

- Créativité, capacité à imaginer et formuler des idées originales ; Souplesse d'esprit et ouverture à la nouveauté

- Indépendance ; Autonomie ; Esprit d'initiative et prise de décision

- Compétences inter-relationnelle = Sens de la communication ; Capacité d'écoute et d'empathie, bienveillance ; Relation à l'autre ; Capacité à travailler en équipe et sens de la responsabilité collective.


La formation participe à l'objectif suivant :être directement utile pour la réalisation des travaux personnels de recherche

Calendrier :

Séance n° 1
Date : 08-12-2025
Horaire : 09h00-12h00 et 13h00-16h00
Intervenant : Équipe Projet CEDRE
Lieu : Marseille, Campus St Charles, salle 15-513

Séance n° 2
Date : 9-12-2025
Horaire : 09h00-12h00 et 13h00-16h00

Séance n° 3
Date : 10-12-2025
Horaire : 09h00-12h00 et 13h00-16h00



Retour à la liste