Statistique en grande dimension

9KUAAN13

ECTS2SEMESTRE9
CMTDTPEITravail personnel
24h0h0h0h25h
Langues d'enseignementFrançais ou anglais


Responsable(s)

 Anne Gégout-Petit

Mots clefsApprentissage statistique, grande dimenion
PrérequisStatistical test theory, standard tests, regression
Objectif pédagogique

A l’issue du module, les étudiants seront en mesure de traiter un problème statistique de grande dimension et de choisir et/ou d'adapter les méthodes d'inférence habituelles à ce cadre.

Organisation et contenus

Un cours théorique est donné sur chaque notion. Les travaux pratiques associés comprennent une partie de simulation pour observer les phénomènes et une partie d'applications sur des données réelles.

Multiple testing issue, False Discovery Rate (FDR), usual method (Bonferroni, local FDR, Benjamini-Hochberg,..), case of correlated data

Criteria of goodness of it: RMSE, confusion matrix,  table ROC curve

Criteria of model selection: AIC, BIC, …

Variable selection: Cross validation, knockoffs, stability selection, variable importance

Penalised regression: LASSO, RIDGE, ELASTICNET

Basic principles of missing values handling

Compétences

Niveaux Description et verbes opérationnels
Connaître 
Comprendre la nécessité de tenir compte de la multiplicité des tests, d'utiliser des méthodes de sélection de modèles ou de variables comme les régressions pénallisées
Appliquer  les méthodes standards pour gérer les tests multiples et les modèles de grande dimension
Analyser 

un problème statistique de grande dimension

Synthétiser
Évaluer

la qualité et les limites de méthodes statistiques mises en oeuvre

Contributions aux Objectifs de Développement Durable des Nations Unis
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  

Modalités de contrôle des connaissances et compétences
Contrôle Continu
  •  
Examen écrit
  •  
Oral / Soutenance
  •  
Rapport / Projet
  •  
  • Aucune étiquette