Module 5 – Initiation à l’analyse de données avec R (tidyverse)
Responsables du module : S.Guitton, R.Bauer
Chaque après-midi du 23 juin au 27 juin 2025
OBJECTIFS
Etre autonome avec le logiciel R pour l’importation d’un tableau de données, la
génération de variables, la réalisation de statistiques descriptives, et des tests et modélisations les plus courants en épidémiologie et recherche clinique.
MODALITES PEDAGOGIQUES
Cours et travaux dirigés en salle d’informatique ; un stagiaire par micro-ordinateur
PROGRAMME
- Gestion d’une base de données : Importation d’une table, tri sur une variable, sélection de lignes selon des conditions définies, fusion de plusieurs tables, génération de variables
- Statistiques descriptives et représentations graphiques
- Tests statistiques univariés: test du Chi2, Mac Nemar, Fisher, Chi2 de tendance, Student, Student apparié, Anova, Kruskal-Wallis, Wilcoxon
- Modélisation : linéaire, logistique, Cox
Le but de ce module n’est pas de discuter des résultats des analyses statistiques mais d’apprendre à utiliser les commandes pour réaliser ces analyses.
PUBLIC CONCERNE
Le cours est prévu pour les « vrais débutants » en programmation R. En revanche, des bases théoriques sont requises : théorie des tests, principaux tests univariés, modèles linéaires, logistiques, Cox… Les bases théoriques des modèles logistiques et de Cox peuvent être consolidées en suivant le module 5 (régression multiple en épidémiologie).
PRE-REQUIS
- Connaissances théoriques en Biostatistique et Epidémiologie :
- – au minimum, M1 de Santé Publique, CESAM, Module de Base de l’Ecole d’été
(ou équivalent) - – idéalement, M2 de Santé Publique – Epidémiologie ou Recherche Clinique.
- – au minimum, M1 de Santé Publique, CESAM, Module de Base de l’Ecole d’été
- Connaissances pratiques :
– bureautique, environnement Windows : pratique courante indispensable.
– logiciels statistiques (ex : SAS, Stata) : pratique courante conseillée.
Télécharger la fiche