Vous regardez une version antérieure (v. /display/minesnancyficm/GIMAS9AD+STATISTIQUE+EN+GRANDE+DIMENSION) de cette page.

afficher les différences afficher l'historique de la page

« Afficher la version précédente Vous regardez la version actuelle de cette page. (v. 4) afficher la version suivante »

GIMAS9AD - Master IMOI

Analyse de données et Data Mining (Mines)

 

Crédits : 4 ECTS

Durée : 42 heures

Semestre : S9

Responsable(s) : 

Sandie FERRIGNO, Maître de Conférences, sandie.ferrigno@mines-nancy.univ-lorraine.fr 

Mots clés :

Analyse de données et Data Mining

Pré requis : 

Avoir des bases en SAS et en Probabilités et Statistique

Objectif général :

Principales méthodes d’analyse de données et du Data Mining

Programmes et contenus :

Objectifs pédagogiques
Dans les années 70-80, le développement des ordinateurs a conduit au stockage d'’informations dont la forme la plus classique était celle qui correspondait à des tableaux de données, généralement de grandes dimensions. Dans de nombreux domaines (géologie, météorologie, médecine, économie, marketing, contrôle de qualité, reconnaissance des formes...), l'’analyse de données a permis de tirer parti de cette information pour la synthétiser, pour servir de base à un processus de décision, ou plus généralement, pour appréhender d'’une certaine manière la nature des phénomènes sous-jacents aux données.
Depuis les années 90, la numérisation systématique de l'’information fait que les organismes, publics ou privés, accumulent des masses considérables d’informations stockées dans des bases de données numériques, amorphes et dynamiques, données faites de chiffres, de textes, d'’images, de sons, etc. Le Data Mining correspond à une "industrialisation" de l’'analyse de données pour permettre une exploitation réelle du capital d'’informations de l’'entreprise : «extraire le minerai précieux de la gangue des données».
Contenu - Programme
Le programme porte sur les principales méthodes d’analyse de données et du Data Mining :
• Analyse en composantes principales
• Analyse des correspondances
• Analyse discriminante
• Classifications automatiques
• Discrimination et classification neuronales
• Segmentation
Leur mise en oeœuvre pose à l’'utilisateur un certain nombre de questions dont les principales sont :
• Quels types de problèmes peut-on traiter ?
• Quelle méthode choisir ?
• Quelles données choisir ?
• Quels genres de résultats peut-on attendre ?
• Quelles en sont les limites ?
• Comment les mettre en œoeuvre ?
Un projet, réalisé en équipe, permettra à chaque élève, au-delà de l’'apprentissage des techniques, d'’apporter une réponse à ces questions et d'’apprendre à utiliser un environnement logiciel moderne d’'analyse de données (SAS et JMP).


Références
G. Saporta, Probabilités, analyse des données et statistique, Technip.
M. Tenenhaus, Statistique, Méthodes pour décrire, expliquer et prévoir, Dunod.
L. Lebart, A. Morineau et M. Piron, Statistique exploratoire multidimensionnelle, Dunod.
S. Tufféry, Data Mining et statistique décisionnelle, Technip.

Compétences : 

Niveaux

Description et verbes opérationnels

Connaître 

 

Comprendre 

 

Appliquer 

 

Analyser 

 

Synthétiser

 

Évaluer

 

Évaluations :

  • Test écrit
  • Contrôle continu
  • Oral, soutenance
  • Projet
  • Rapport
  • Aucune étiquette