Analyse, classification, indexation des données

Informations

Langue d'enseignement : Français
Crédits ECTS: 6

Programme

  • Heures d'enseignement dispensées à l'étudiant : 48 heures
  • Temps de travail personnel : 102 heures

Objectifs et compétences

Objectifs :
Les évolutions technologiques permettent maintenant de produire des données en masse, de les stocker et de les traiter dans des temps raisonnables. L'analyse, la classification et l'indexation des données tiennent une position de plus en plus centrale dans des domaines variés de l'informatique (recherche de contenus, analyse de comportements d'utilisateurs, etc).

L'objectif de cet enseignement est de présenter les bases théoriques et les méthodes pratiques liées à la classification (supervisée, non supervisée, interactive) des données.

Programme:

- Rappels mathématiques orientés outils (notions d'algèbre linéaire, probabilités, descente de gradient, lagrangien)

- Réduction en dimension (analyse en composantes principales, en composantes discriminantes)

- Classification supervisée (annotation et mesure de qualité d'une classification, approches bayésiennes, champs de Markov, principe d'entrainement et de tests, approche linéaire discriminante, K plus proches voisins, classification multi-classe)

- Classification non supervisée (mesure de qualité d'un clustering, algorithmes de clustering)

- Classification interactive (visualisation d'information, fouille de données interactive, sélection interactive et adaptation des mesures de similarité)

À l'issue de cet enseignement, les étudiants

- connaîtront les principes généraux de la classification supervisée et non supervisée, ainsi que les techniques les plus usuielles

- sauront définir et mettre en place une chaîne complète dédiée à la classification supervisée ou non supervisée

- seront capables d'implémenter les méthodes usuelles de classification supervisée ou non supervisée et connaîtront leur complexité et les cas de convergence.

Organisation pédagogique

- Non défini -

Contrôle des connaissances

Session 1:

Contrôle continu, coefficient 0.5 (mini projets à réaliser sur jeux de données)

Examen final (1h30), coefficient 0.5

Session 2:

Contrôle continu, report session 1, coefficient 0.5

Examen écrit (1h30) ou oral selon effectif, coefficient 0.5

Note finale session 2: max(NoteEx2, 0.5*NoteEx2 + 0.5*NoteCC)

Lectures recommandées

- Non défini -

Responsable de l'unité d'enseignement

Jean-Philippe Domenger

Enseignants

- Non défini -