Lieu : Salle 2 du Collège Doctoral Bât 3 Campus Triolet Observations : 1 jour Mots clés : statistiques appliquées, modèles linéaires, reproductibilité, visualisation scientifique, intégrité scientifique Début de la formation : 10 avril 2026 Fin de la formation : 10 avril 2026 Date ouverture des inscriptions : Date fermeture des inscriptions : 1er avril 2026 Objectifs : Vous apprendrez à comprendre réellement ce que vos statistiques disent, et ne disent pas, de vos données. Vous verrez comment un modèle linéaire unifie la plupart des tests classiques, comment éviter les pièges les plus répandus en publication et comment produire des graphiques lisibles, honnêtes et convaincants. À l’issue de la journée, vous serez en mesure d’améliorer immédiatement la robustesse et la crédibilité de vos analyses. Programme : MODULE 1 : L'EPISTEMOLOGIE DE LA DONNEE & LE MODELE ZERO
De la Description à la Prédiction
• La moyenne comme modèle prédictif : ≠ simple calcul ; = estimateur de β₀ dans un modèle Intercept- Only : yi= β0+ εi
• Démonstration : β₀ minimise la SSE (Somme des Carrés des Erreurs).
• Introduction intuitive des Moindres Carrés.
Robustesse & Indicateurs de Dispersion
• Différence entre : Écart-type (SD) = dispersion réelle de la populatio ; Erreur standard (SEM) = précision de la moyenne et Intervalle de Confiance (IC) = incertitude d’estimation
• Pièges fréquents en publication : l’usage abusif de la SEM.
• La médiane = estimateur robuste (minimise la somme des valeurs absolues).
• Lien avec la régression quantile (introduction conceptuelle). Atelier court (ordinateur ou papier) :
• Comparaison moyenne / médiane avec un outlier extrême.
• Discussion : quel indicateur utiliser pour la publication ?
La Crise de la Reproductibilité
Présentation de la Replication Crisis ; P-hacking, HARKing : mécanismes et dangers ; Lien avec le modèle :
ajuster trop fort = overfitting.
Livrable remis : Checklist d’intégrité statistique (auto-évaluation pour futures publications).
MODULE 2 : L’UNIFICATION PAR LE MODÈLE LINÉAIRE
La « Pierre de Rosette » des Tests
Tous les tests classiques = régression linéaire : Test t indépendant → lm(y ~ groupe) ; ANOVA 1 facteur
→ lm(y ~ groupe) (dummy coding) ; Corrélation → lm(y ~ x) et Test t apparié → lm(diff ~ 1) Interpréter tous les tests = comprendre la pente β₁.
Support : tableau de correspondance (fourniture papier ou numérique). Démonstration live (R ou Python) :
• Test t vs Régression linéaire → même p-value jusqu’à 15 décimales.
Significativité & Tailles d’Effet
Limites de la p-value ; Importance des Tailles d’Effet (Cohen’s d, η², R²) ; Intervalles de Confiance comme indicateur central ; Via modèle linéaire : l’IC autour de β₁ = précision de l’effet + significativité.
MODULE 3 : VISUALISATION & NARRATIVITÉ
La Grammaire des Graphiques & l’Esthétique de la Donnée
• Principes de Tufte : ratio encre/données, suppression du chartjunk.
• Pourquoi bannir les barplots de moyennes : cachent la distribution, le N, les outliers.
• Alternatives modernes : Boxplots ; Violin plots ; Rainclouds et Jitter plots (visualisation des points bruts = indispensable).
• Quartet d’Anscombe : même moyenne/variance mais graphiques radicalement différents.
Atelier pratique « Musée des horreurs graphiques » Dispositif : travail en sous-groupes.
Matériel : graphiques fautifs issus de publications (anonymisés). Tâches :
1. Identifier les erreurs (axes tronqués, logs non indiqués, confusion SD/SEM, couleurs daltoniennes…).
2. Produire une version corrigée sur papier.
3. Présenter oralement comme un reviewer (posture d’évaluation).
MODULE 4 : ATELIER DE PUBLICATION (JEU DE RÔLE)
Standards de Reporting
• Présentation des guidelines SAMPL (reporting statistique).
• Checklist pour décrire : logiciel utilisé, version / prérequis/test d’hypothèses / unités, décimales pertinentes / choix du test justifié / présence de tailles d’effet.
Jeu de rôle « Peer Review : Auteurs vs Reviewers »
Scénario :
• Groupe Auteurs : reçoit jeux de résultats (tableaux + graphiques). Rédige un résumé de résultats
• Groupe Reviewers : reçoit les mêmes résultats avec données brutes révélant des failles (outlier impactant modèle). Rédige une lettre de décision (acceptation / révision / rejet).
Confrontation en plénière : Auteurs défendent leurs choix. Reviewers argumentent sur robustesse, modèle, visualisations.
Pré-requis : Aucun prérequis technique strict ; une familiarité minimale avec la manipulation de données est un atout.
Apporter un ordinateur avec R ou Python installés (ou accès à un notebook en ligne) pouvant se connecter à internet sur le Campus Triolet (réseau Eduroam).
Méthode pédagogique : Pédagogie active et démonstrative : expérimentations corporelles (régression humaine), démonstrations live (R/Python), ateliers pratiques, analyses collaboratives, évaluation critique de graphiques, jeu de rôle « peer review ». Supports numériques fournis, checklist d’intégrité statistique et ressources complémentaires. Possibilité de poser des questions au formateur après la session.
Compétences acquises à l'issue de la formation : o Interpréter correctement les indicateurs descriptifs et les tests classiques
o Utiliser le modèle linéaire comme cadre unificateur
o Évaluer la robustesse d’une analyse et identifier les pièges statistiques en publication
o Produire des visualisations adaptées et scientifiquement honnêtes
o Comprendre les exigences de reporting et adopter une posture critique de reviewer
o Renforcer l’intégrité scientifique de ses propres travaux
o Langue de la formation : Français
Les Compétences et capacités visées à l'issue de la formation (fiches RNCP)
Arrêté du 22 février 2019 définissant les compétences des diplômés du doctorat et inscrivant le doctorat au répertoire national de la certification professionnelle. https://www.legifrance.gouv.fr/loda/id/JORFTEXT000038200990/ Bloc 1 : Conception et élaboration d’une démarche de recherche et développement, d’études et prospective - Identifier et résoudre des problèmes complexes et nouveaux impliquant une pluralité de domaines, en mobilisant les connaissances et les savoir-faire les plus avancés - S’adapter en permanence aux nécessités de recherche et d’innovation au sein d’un secteur professionnel Bloc 2 : Mise en œuvre d’une démarche de recherche et développement, d’études et prospective - Mettre en œuvre les méthodes et les outils de la recherche en lien avec l’innovation - Garantir la validité des travaux ainsi que leur déontologie et leur confidentialité en mettant en œuvre les dispositifs de contrôle adaptés - Gérer les contraintes temporelles des activités d’études, d’innovation ou de R&D Bloc 3 : Valorisation et transfert des résultats d’une démarche R&D, d’études et prospective - Respecter les principes de déontologie et d’éthique en relation avec l’intégrité des travaux et les impacts potentiels - Mettre en œuvre l’ensemble des dispositifs de publication à l’échelle internationale permettant de valoriser les savoirs et connaissances nouvelles Bloc 4 : Veille scientifique et technologique à l’échelle internationale - Acquérir, synthétiser et analyser les données et informations scientifiques et technologiques d’avant-garde à l’échelle internationale - Disposer d’une compréhension, d’un recul et d’un regard critique sur l’ensemble des informations de pointe disponibles Bloc 5 : Formation et diffusion de la culture scientifique et technique - Enseigner et former des publics diversifiés à des concepts, outils et méthodes avancés - S’adapter à un public varié pour communiquer et promouvoir des concepts et démarches d’avant-garde Compétences sociales - Créativité, capacité à imaginer et formuler des idées originales ; Souplesse d'esprit et ouverture à la nouveauté - Connaissance et Maîtrise de soi et de son comportement = Capacité à s'auto-évaluer et se remettre en question ; Connaissance de ses propres limites ; Dosage Rigueur/souplesse - Indépendance ; Autonomie ; Esprit d'initiative et prise de décision - Compétences inter-relationnelle = Sens de la communication ; Capacité d'écoute et d'empathie, bienveillance ; Relation à l'autre ; Capacité à travailler en équipe et sens de la responsabilité collective. La formation participe à l'objectif suivant :former à l’éthique de la recherche et à l’intégrité scientifique
Calendrier :
Séance n° 1 Date : 10-04-2026 Horaire : 09h00 à 12h30 Intervenant : PYTHAGORE - Ahmad Yousno Lieu : Salle 2 du Collège Doctoral Campus Triolet Bat 3
Séance n° 2 Date : 10-04-2026 Horaire : 13h30 à 17h00 Intervenant : PYTHAGORE - Ahmad Yousno Lieu : Salle 2 du Collège Doctoral Campus Triolet Bat 3
|