2020-2021 / MATH2021-1

High-dimensional data analysis

Durée

30h Th, 15h Pr, 30h Proj.

Nombre de crédits

 Master en science des données, à finalité5 crédits 
 Master : ingénieur civil en science des données, à finalité5 crédits 
 Master en sciences mathématiques, à finalité5 crédits 
 Master en sciences mathématiques5 crédits 

Enseignant

Gentiane Haesbroeck

Langue(s) de l'unité d'enseignement

Langue anglaise

Organisation et évaluation

Enseignement au premier quadrimestre, examen en janvier

Horaire

Horaire en ligne

Unités d'enseignement prérequises et corequises

Les unités prérequises ou corequises sont présentées au sein de chaque programme

Contenus de l'unité d'enseignement

Le cours est consacré aux thématiques suivantes:
- Analyse exploratoire des données - Distributions multivariées (notamment la distribution normale), estimation ponctuelle (méthode du maximum de vraisemblance) et éléments de statistique inférentielle - Estimation de la matrice de variance covariance: estimation classique, estimation régularisée et estimation robuste - Techniques de réduction de la dimension: Analyse en composantes principales, Multidimensional scaling, tSNE - Classification supervisée: analyse discriminante et régression logistique - Rangs et quantiles multivariés

Acquis d'apprentissage (objectifs d'apprentissage) de l'unité d'enseignement

A l'issue du cours, l'étudiant devra être capable de déterminer quelle technique multivariée doit être utilisée pour réduire la dimension d'un problème, classer des observations,...

Savoirs et compétences prérequis

Une formation en statistique univariée est indispensable. Par ailleurs, même si les justifications mathématiques ne sont pas développées en détail (dans la plupart des chapitres du moins), les étudiants doivent connaitre les notions de base de l'algèbre linéaire (vecteur, matrice, déterminant, valeurs et vecteurs propres...).

Activités d'apprentissage prévues et méthodes d'enseignement

La théorie est exposée de manière ex-cathedra mais les séances de travaux pratiques demandent la participation active des étudiants. Ces travaux pratiques concernent des analyses de données et la réalisation de simulations afin de comparer certaines techniques en exploitant le logiciel R (en libre accès). Un énoncé sera mis en ligne au début du TP et les étudiants seront invités à traiter les exercices proposés, avec l'aide ponctuelle d'un assistant qui encadre les séances. A la fin de la séance, un récapitulatif des résultats attendus est présenté oralement.

Mode d'enseignement (présentiel, à distance, hybride)

Le cours est prévu au premier quadrimestre le mercredi après-midi. 
Il est organisé en présentiel. Dans la mesure du possible, un enregistrement vidéo de la présentation "théorique" du cours sera réalisé de manière systématique et mis en ligne sur MyULiège dans les jours suivants le cours. Il n'y a pas d'enregistrement ni vidéo prévu pour les séances pratiques puisque celles-ci concistent en du travail personnel. 

Adaptations organisationnelles liées au contexte sanitaire

Par défaut, l'organisation du cours et de l'examen est telle qu'expliquée dans les sections qui décrivent ces dispositions.
Cependant, en cas d'impossibilité de prévoir du présentiel pendant le quadrimestre ou pendant la période d'examen, voici les adapations qui seront apportées:
- La théorie sera diffusée soit par vidéos mises en ligne sur MyUliège (avec des séances virtuelles de QR  organisées via Collaborate), soit via des séances de cours réalisées sur Collaborate (avec enregistrement de la séance).
- Les séances pratiques seront maintenues mais organisées en virtuel: les énoncés seront diffusés avant la séance et une classe virtuelle sera ouverte pendant la durée de la séance.
- L'examen sera organisé à distance (énoncés diffusés via eCampus, résolution et code R soumis sur la plateforme à la fin de l'examen). Une vérification approfondie du caractère individuel de la résolution de l'examen sera réalisée et en cas de doute, un entretion oral virtuel avec le professeur pourra être planifié.

Lectures recommandées ou obligatoires et notes de cours

Il n'existe pas de notes de cours. Les transparents exploités au cours seront mis en ligne sur la plateforme eCampus. Par ailleurs, pour chaque thème, un livre de référence sera proposé pour de plus amples informations.

Modalités d'évaluation et critères

Vous trouverez ci-dessous les modalités d'évaluation envisagées pour les examens en présentiel et à distance ainsi que celle souhaitée en cas de session hybride. En fonction de l'évolution sanitaire, la modalité choisie vous sera communiquée au plus tard un mois avant le début de la session d'examen.

Toutes sessions confondues :

- En présentiel

évaluation écrite ( questions ouvertes )

- En distanciel

évaluation écrite ( questions ouvertes )

- Si évaluation en "hybride"

préférence en présentiel


Explications complémentaires:

La cote finale est une moyenne pondérée calculée à partir des résultats obtenus aux épreuves suivantes:
-  travaux personnels réalisés pendant le quadrimestre
- examen écrit combinant une analyse de données et des simulations
 
Modalité d'évaluation arrêtée le 11/12/2020 : l'examen écrit se déroulera en présentiel


 

Stage(s)

Remarques organisationnelles

Le cours est enseigné en anglais.

Contacts

Enseignant: Gentiane HAESBROECK, Institut de Mathématique (B37), g.haesbroeck@ulg.ac.be