Statistique en grande dimension 9KUAAN13 | ECTS | 2 | SEMESTRE | 9 | |||||||||||||||||||||||||||||||
CM | TD | TP | EI | Travail personnel | |||||||||||||||||||||||||||||||
24h | 0h | 0h | 0h | 25h | |||||||||||||||||||||||||||||||
Langues d'enseignement | Français ou anglais | ||||||||||||||||||||||||||||||||||
Responsable(s) | |||||||||||||||||||||||||||||||||||
Mots clefs | Apprentissage statistique, grande dimenion | ||||||||||||||||||||||||||||||||||
Prérequis | Statistical test theory, standard tests, regression | ||||||||||||||||||||||||||||||||||
Objectif pédagogique | |||||||||||||||||||||||||||||||||||
A l’issue du module, les étudiants seront en mesure de traiter un problème statistique de grande dimension et de choisir et/ou d'adapter les méthodes d'inférence habituelles à ce cadre. | |||||||||||||||||||||||||||||||||||
Organisation et contenus | |||||||||||||||||||||||||||||||||||
Un cours théorique est donné sur chaque notion. Les travaux pratiques associés comprennent une partie de simulation pour observer les phénomènes et une partie d'applications sur des données réelles. Multiple testing issue, False Discovery Rate (FDR), usual method (Bonferroni, local FDR, Benjamini-Hochberg,..), case of correlated data Criteria of goodness of it: RMSE, confusion matrix, table ROC curve Criteria of model selection: AIC, BIC, … Variable selection: Cross validation, knockoffs, stability selection, variable importance Penalised regression: LASSO, RIDGE, ELASTICNET Basic principles of missing values handling | |||||||||||||||||||||||||||||||||||
Compétences | |||||||||||||||||||||||||||||||||||
Niveaux | Description et verbes opérationnels | ||||||||||||||||||||||||||||||||||
Connaître | |||||||||||||||||||||||||||||||||||
Comprendre | la nécessité de tenir compte de la multiplicité des tests, d'utiliser des méthodes de sélection de modèles ou de variables comme les régressions pénallisées | ||||||||||||||||||||||||||||||||||
Appliquer | les méthodes standards pour gérer les tests multiples et les modèles de grande dimension | ||||||||||||||||||||||||||||||||||
Analyser | un problème statistique de grande dimension | ||||||||||||||||||||||||||||||||||
Synthétiser | |||||||||||||||||||||||||||||||||||
Évaluer | la qualité et les limites de méthodes statistiques mises en oeuvre | ||||||||||||||||||||||||||||||||||
Contributions aux Objectifs de Développement Durable des Nations Unis | |||||||||||||||||||||||||||||||||||
Modalités de contrôle des connaissances et compétences | |||||||||||||||||||||||||||||||||||
Contrôle Continu | Examen écrit | Oral / Soutenance | Rapport / Projet |