Lieu : Salle 2 du Collège Doctoral Bât 3 Campus Triolet Observations : 1 day Mots clés : statistical modelling, linear model, effect sizes, reproducibility, scientific visualisation Début de la formation : 20 mai 2026 Fin de la formation : 20 mai 2026 Date ouverture des inscriptions : Date fermeture des inscriptions : 12 mai 2026 Objectifs : Gain a clear, intuitive and practical understanding of the statistical tools you use every day. Learn how classical tests all fit within one unified model, how to detect and avoid common publication pitfalls, how to produce honest and compelling figures, and how to assess statistical integrity like a reviewer. You will leave with stronger analytical skills and immediately applicable tools for your ongoing research. Programme : MODULE 1 - THE EPISTEMOLOGY OF DATA & THE “ZERO MODEL”
From Description to Prediction
• The mean as a predictive model : not a simple arithmetic value, but the estimator of β₀ in an Intercept- Only Model : ( y_i = eta_0 + varepsilon_i).
• Demonstration : β₀ minimises the SSE (Sum of Squared Errors).
• Intuitive introduction to Least Squares.
Pedagogical activity – “Human Regression” (Phase 1) : Participants position themselves along a physical axis (e.g., commuting time) ; The group’s balance point represents the mean ; Arm stretched to the centre = visualisation of the residual ε ; Intuitive understanding of variance and sensitivity to outliers.
Robustness & Dispersion Indicators
• Differences between : Standard Deviation (SD) = actual population variability ; Standard Error of the Mean (SEM) = precision of the mean ; Confidence Interval (CI) = estimation uncertainty
• Frequent publication pitfalls : misuse of the SEM.
• The median as a robust estimator (minimises the sum of absolute deviations).
• Conceptual link with quantile regression. Short workshop (paper or computer) :
• Compare mean vs median using an extreme outlier.
• Discussion : Which indicator should be reported for publication ?
The Reproducibility Crisis
Overview of the Replication Crisis ; P-hacking and HARKing : mechanisms and risks ; Link with modelling : excessive model fitting = overfitting.
Delivered material : Statistical Integrity Checklist (self-assessment for future publications).
MODULE 2 UNIFYING STATISTICS THROUGH THE LINEAR MODEL
The “Rosetta Stone” of Statistical Tests
All major tests = linear regression : Independent t-test → lm (y ~ group) / One-way ANOVA → lm (y ~ group) (dummy coding) / Correlation → lm (y ~ x) / Paired t-test → lm (diff ~ 1) Key point : interpreting all tests = understanding the slope β₁.
Material : correspondence table (printed or digital). Live demonstration (R or Python) :
• Independent t-test vs Linear Regression → identical p-value to the 15th decimal.
• Strong pedagogical impact : one unified framework.
Statistical Significance & Effect Sizes
Limitations of p-values ; Importance of Effect Sizes (Cohen’s d, η², R²) ; Confidence intervals as central indicators ; In the linear model : the CI around β₁ expresses both effect precision and significance.
Quick exercise : Interpret three outputs :
• Small p-value but negligible effect,
• Large p-value with meaningful effect,
• Wide CI → strong uncertainty.
MODULE 3 VISUALISATION & DATA STORYTELLING
3.1 – The Grammar of Graphics & Data Aesthetics
• Tufte’s principles : data–ink ratio, removal of chartjunk.
• Why barplots of means should be avoided : hide distribution, N, and outliers.
• Recommended modern alternatives : boxplots, violin plots, raincloud plots, jitter plots.
• Anscombe’s Quartet : identical statistics, radically different plots.
3.2 – Practical Workshop : “The Museum of Graphical Horrors”
Material : flawed real scientific plots (anonymised). Tasks :
• Identify errors (truncated axes, missing log labels, SD/SEM confusion, colourblind issues…).
• Propose à corrected version (paper sketch).
• Oral presentation in a reviewer’s posture.
MODULE 4 PUBLICATION WORKSHOP (ROLE-PLAY)
Reporting Standards
Overview of SAMPL guidelines.
• Reporting checklist : software + version / assumption checks / units and decimal precision / justified test choice / presence of effect sizes.
Role-play : “Peer Review – Authors vs Reviewers”
Scenario :
• Authors : receive summary results (tables + figures). Produce a short results paragraph (15 min).
• Reviewers : receive the same results plus raw data revealing weaknesses (e.g., outlier influencing the model). Write a decision letter (accept/revise/reject).
Plenary confrontation : Authors defend choices. Reviewers critique robustness, model selection, and visualisation. Pedagogical objectives :
• Strengthen critical thinking,
• Understand editorial expectations,
• Evaluate statistical quality rigorously.
Pré-requis : No strict technical prerequisites; minimal familiarity with data manipulation is an asset.
Bring a computer with R or Python installed (or access to an online notebook) that can connect to the internet on the Triolet Campus (Eduroam network).
Méthode pédagogique : Active and experiential learning : embodied regression activity, live demonstrations (R/Python), short applied workshops, group analyses of flawed visualisations, role-play simulations of peer review, and use of statistical integrity checklists. Digital resources and optional follow-up support provided.
Compétences acquises à l'issue de la formation : o Interpret descriptive indicators and classical tests through the linear model
o Identify limitations of p-values and use effect sizes and confidence intervals correctly
o Evaluate robustness, detect modelling biases, and recognise publication pitfalls
o Produce modern, transparent and distribution-aware visualisations
o Apply reporting standards (SAMPL) and understand editorial expectations
o Strengthen scientific integrity when analysing and presenting data
Les Compétences et capacités visées à l'issue de la formation (fiches RNCP)
Arrêté du 22 février 2019 définissant les compétences des diplômés du doctorat et inscrivant le doctorat au répertoire national de la certification professionnelle. https://www.legifrance.gouv.fr/loda/id/JORFTEXT000038200990/ Bloc 1 : Conception et élaboration d’une démarche de recherche et développement, d’études et prospective - Identifier et résoudre des problèmes complexes et nouveaux impliquant une pluralité de domaines, en mobilisant les connaissances et les savoir-faire les plus avancés - S’adapter en permanence aux nécessités de recherche et d’innovation au sein d’un secteur professionnel Bloc 2 : Mise en œuvre d’une démarche de recherche et développement, d’études et prospective - Mettre en œuvre les méthodes et les outils de la recherche en lien avec l’innovation - Garantir la validité des travaux ainsi que leur déontologie et leur confidentialité en mettant en œuvre les dispositifs de contrôle adaptés - Gérer les contraintes temporelles des activités d’études, d’innovation ou de R&D Bloc 3 : Valorisation et transfert des résultats d’une démarche R&D, d’études et prospective - Respecter les principes de déontologie et d’éthique en relation avec l’intégrité des travaux et les impacts potentiels - Mettre en œuvre l’ensemble des dispositifs de publication à l’échelle internationale permettant de valoriser les savoirs et connaissances nouvelles Bloc 4 : Veille scientifique et technologique à l’échelle internationale - Acquérir, synthétiser et analyser les données et informations scientifiques et technologiques d’avant-garde à l’échelle internationale - Disposer d’une compréhension, d’un recul et d’un regard critique sur l’ensemble des informations de pointe disponibles Bloc 5 : Formation et diffusion de la culture scientifique et technique - Enseigner et former des publics diversifiés à des concepts, outils et méthodes avancés - S’adapter à un public varié pour communiquer et promouvoir des concepts et démarches d’avant-garde Compétences sociales - Créativité, capacité à imaginer et formuler des idées originales ; Souplesse d'esprit et ouverture à la nouveauté - Connaissance et Maîtrise de soi et de son comportement = Capacité à s'auto-évaluer et se remettre en question ; Connaissance de ses propres limites ; Dosage Rigueur/souplesse - Indépendance ; Autonomie ; Esprit d'initiative et prise de décision - Compétences inter-relationnelle = Sens de la communication ; Capacité d'écoute et d'empathie, bienveillance ; Relation à l'autre ; Capacité à travailler en équipe et sens de la responsabilité collective. La formation participe à l'objectif suivant :former à l’éthique de la recherche et à l’intégrité scientifique
Calendrier :
Séance n° 1 Date : 20-05-2026 Horaire : 09h00 à 12h30 Intervenant : PYTHAGORE - Ahmad Yousno Lieu : Salle 2 du Collège Doctoral Campus Triolet Bat 3
Séance n° 2 Date : 20-05-2026 Horaire : 13h30 à 17h00 Intervenant : PYTHAGORE - Ahmad Yousno Lieu : Salle 2 du Collège Doctoral Campus Triolet Bat 3
|