Arborescence des pages
ConfigureOutils de l'espace
Aller directement à la fin des métadonnées
Aller au début des métadonnées

CES9AE

Traitement statistique des données

 

Crédits : 4 ECTS

Durée : 36 heures

Semestre : S9

Responsable(s) :

 Olivier DECK, Professeur,  olivier.deck@mines-nancy.univ-lorraine.fr, Judith Sausse, Professeur,  judith.sausse@mines-nancy.univ-lorraine.frThierry VERDEL, Professeur,  thierry.verdel@mines-nancy.univ-lorraine.fr


Mots clés :

 exploration et visualisation des données - analyse statistique - modélisation et prévision

Pré requis : le cours de statistiques de première année ou un niveau équivalent


Objectif général : Traitement statistique, analyse de données

Ce cours n’est pas ouvert aux élèves du département GIMA.

Programmes et contenus :

Dans les années 1970, le développement des ordinateurs a conduit au stockage d’informations dont la forme la plus classique était celle qui correspondait à des tableaux de données, généralement de grandes dimensions. Dans de nombreux domaines (géologie, météorologie, médecine, économie, marketing, contrôle de qualité, reconnaissance des formes, etc.), l’analyse des données a permis de tirer parti de cette information pour la synthétiser, pour servir de base à un processus de décision, ou plus généralement, pour appréhender d’une certaine manière la nature des phénomènes sous-jacents aux données.
Plus particulièrement, les méthodes de prévision permettaient de prévoir le comportement futur d’un phénomène par une modélisation fondée sur la façon dont il s’est réalisé dans le passé, et sur son contexte.
Depuis les années 90, la numérisation systématique de l’information fait que les organismes publics ou privés accumulent des masses considérables d’informations stockées dans des bases de données numériques, amorphes et dynamiques, données faites de chiffres, de textes, d’images, de sons, etc. On parle aujourd'hui de "Big Data". Le Data mining (fouille de données) correspond à une industrialisation de l’analyse des données pour permettre une exploitation réelle du capital d’information de l’entreprise : « extraire le minerai précieux de la gangue des données ».

Compétences : 

Niveaux

Description et verbes opérationnels

Connaître 

Les principales techniques abordées sont :
- la régression multiple, l'analyse de la variance et la régression logistique ;
- les techniques de modélisation et de prévision des séries chronologiques ;
- les méthodes factorielles : l'analyse en composantes principales, l'analyse des correspondances et l'analyse discriminante ;
- les méthodes de classification automatiques et les méthodes de segmentation par arbres de décision ;
- les méthodes non-linéaires neuronales pour la prévision, la discrimination et la classification.
La mise en oeuvre de ces techniques pose à l’utilisateur un certain nombre de questions dont les principales sont :
- Quels types de problèmes peut-on traiter ?
- Quelles méthodes pour quelles données ?
- Comment les mettre en oeuvre ?
- Quels genres de résultats peut-on attendre ?
- Quelles en sont les limites ?
On utilise systématiquement dans ce cours les logiciels JMP et R, à la fois dans la partie magistrale et dans la partie TD, en privilégiant des exemples réels dans les domaines les plus variés possibles.

Comprendre 

Appliquer 

Analyser 

Synthétiser

Évaluer

Évaluations :

  • Test écrit
  • Contrôle continu
  • Oral, soutenance
  • Projet
  • Rapport
  • Aucune étiquette