STA301 Analyse de données de grande dimension

Informations

Langue d'enseignement : Français
Crédits ECTS: 3

Programme

  • Heures d'enseignement dispensées à l'étudiant : 30 heures
  • Temps de travail personnel : 45 heures

Objectifs et compétences

Objectifs :
Présenter différentes méthodes statistique pouvant s'appliquer à des données de grande dimension où le nombre de variables explicatives dépasse largement le nombre d'individus. L’étudiant à l’issue de cet enseignement doit maîtriser des méthodes de réduction de dimension (PLS, sparse-PLS), de pénalisation (Lasso), ainsi que des méthodes non-paramétriques (CART, Forêts aléatoires). Un accent est mis sur les problématiques de prédiction (du statut de nouveaux individus par exemple) et de sélection de variables.

Compétences :
  • Identifier la méthode statistique la plus adaptée à un schéma d’étude donné ou à une question de recherche même lorsque celle-ci n’est pas formulée en termes statistiques
  • Rechercher, comprendre et appliquer de nouvelles méthodes statistiques
  • Traduire un algorithme dans un langage de programmation

Organisation pédagogique

le mode de fonctionnement de l'UE est présenté au début des enseignements

Contrôle des connaissances

Contrôle continu

Lectures recommandées

l'ensemble des références bibliographiques est communiqué au début des enseignements

Responsable de l'unité d'enseignement

Robin Genuer

Enseignants

la composition de l'ensemble de l'équipe pédagogique est communiquée au début des enseignements