2019-2020 / MATH2021-1

High-dimensional data analysis

Durée

30h Th, 15h Pr, 30h Proj.

Nombre de crédits

 Master en science des données, à finalité5 crédits 
 Master : ingénieur civil en science des données, à finalité5 crédits 
 Master en sciences mathématiques, à finalité5 crédits 
 Master en sciences mathématiques5 crédits 

Enseignant

Gentiane Haesbroeck

Langue(s) de l'unité d'enseignement

Langue anglaise

Organisation et évaluation

Enseignement au premier quadrimestre, examen en janvier

Horaire

Horaire en ligne

Unités d'enseignement prérequises et corequises

Les unités prérequises ou corequises sont présentées au sein de chaque programme

Contenus de l'unité d'enseignement

Le cours est consacré aux thématiques suivantes:
- Analyse exploratoire des données - Distributions multivariées (notamment la distribution normale), estimation ponctuelle (méthode du maximum de vraisemblance) et éléments de statistique inférentielles - Estimation de la matrice de variance covariance: estimation classique, estimation régularisée et estimation robuste - Techniques de réduction de la dimension: Analyse en composantes principales, Multidimensional scaling, tSNE, Analyse en composantes indépendantes - Classification supervisée: analyse discriminante et régression logistique - Rangs et quantiles multivariés

Acquis d'apprentissage (objectifs d'apprentissage) de l'unité d'enseignement

A l'issue du cours, l'étudiant devra être capable de déterminer quelle technique multivariée doit être utilisée pour réduire la dimension d'un problème, classer des observations,...

Savoirs et compétences prérequis

Une formation en statistique univariée est indispensable. Par ailleurs, même si les justifications mathématiques ne sont pas développées en détail, les étudiants doivent connaitre les notions de base de l'algèbre linéaire (vecteur, matrice, déterminant, valeurs et vecteurs propres...).

Activités d'apprentissage prévues et méthodes d'enseignement

Les travaux pratiques concernent l'analyse de données et la réalisation de simulations afin de comparer certaines techniques en exploitant le logiciel R (en libre accès).

Mode d'enseignement (présentiel ; enseignement à distance)

Le cours est prévu au premier quadrimestre le mercredi après-midi. 

Lectures recommandées ou obligatoires et notes de cours

Il n'existe pas de notes de cours. Les transparents exploités au cours seront mis en ligne sur la plateforme eCampus. Par ailleurs, pour chaque thème, un livre de référence sera proposé pour de plus amples informations.

Modalités d'évaluation et critères

La cote finale est une moyenne pondérée calculée à partir des résultats obtenus aux épreuves suivantes:
-  travaux personnels réalisés pendant le quadrimestre
- examen écrit combinant une analyse de données et des simulations
 

Stage(s)

Remarques organisationnelles

Le cours est enseigné en anglais.

Contacts

Enseignant: Gentiane HAESBROECK, Institut de Mathématique (B37), g.haesbroeck@ulg.ac.be

Adaptation des engagements pédagogiques suite à la pandémie de COVID-19 pour la session de mai-juin

Méthodes d'apprentissage mises en œuvre : enseignement à distance

Matière de l'évaluation

Méthodes d'évaluation

Contact

Adaptation des engagements pédagogiques suite à la pandémie de COVID-19 pour la session août-sept

Matière de l'évaluation

Même matière qu'en janvier.  Il est possible de reporter la cote globale des projets si celle-ci est d'au moins 10/20. Sinon, de nouveaux énoncés de projets seront transmis.

Méthodes d'évaluation (et plateforme utilisée)

Examen écrit à distance.
Les questions seront envoyées par email à 9h le jour de l'examen et les résolutions manuscrites (ainsi que le code R et les graphiques générés) devront être renvoyées pour 13h au plus tard par email. 

Contact(s)