Durée
20h Th
Nombre de crédits
| Formation doctorale en sciences (BBMC) | 3 crédits |
Enseignant
Langue(s) de l'unité d'enseignement
Langue française
Organisation et évaluation
Enseignement au deuxième quadrimestre
Horaire
Unités d'enseignement prérequises et corequises
Les unités prérequises ou corequises sont présentées au sein de chaque programme
Contenus de l'unité d'enseignement
Les quatre thèmes suivants de statistique multivariée sont considérés :
Thème 1: vecteurs moyens, matrices de variances-covariances, distribution multinormale et tests d'inférence classique (tests d'égalité des vecteurs moyens, tests d'homoscédasticité, tests de normalité)
Thème 2: Analyse exploratoire multivariée à l'aide de l'Analyse en Composantes Principales et la classification automatique
Thème 3: Analyse discriminante
Thème 4: Régression multiple et quelques généralisations
Les techniques sont expliquées sans entrer dans le détail des justifications mathématiques.
Acquis d'apprentissage (objectifs d'apprentissage) de l'unité d'enseignement
A l'issue de ce cours, les doctorants devront être capables de
- déterminer si une des méthodes vues au cours est appropriée pour analyser un ensemble de données de grande dimension dans leur domaine.
- appliquer la méthode en question.
- interpréter les résultats des analyses effectuées.
Les doctorants seront aussi capables de détecter les situations dans lesquelles les techniques de base ne sont pas applicables (violation des hypothèses de normalité, d'indépendance,...).
Savoirs et compétences prérequis
Les étudiants doivent avoir déjà suivi un cours de base de statistique descriptive et inférentielle. Les notions suivantes seront exploitées sans être ré-expliquées: paramètres statistiques classiques univariés (moyenne, quantiles, variance, écart-type, dissymétrie,...), distribution normale univariée, tests d'hypothèse dans le contexte univarié.
Par ailleurs, même si le professeur n'insiste pas sur les justifications mathématiques, certaines notions de base d'algèbre linéaire sont indispensables afin de comprendre les outils principaux de la statistique multivariée (notamment les notions de vecteurs, produits scalaires, matrices, projection orthogonale, matrices inverses et déterminant).
En ce qui concerne le logiciel R, les notions de base sont brièvement décrites dans les documents pédagogiques mis en ligne.
Activités d'apprentissage prévues et méthodes d'enseignement
12h de cours ex-cathedra et de l'ordre de 8h d'auto-apprentissage du logiciel R.
Mode d'enseignement (présentiel ; enseignement à distance)
Cette année, le cours se donnera du lundi 27 janvier au jeudi 30 janvier de 9h à 10h30 et de 11h à 12h30.
En complément à l'enseignement en présentiel, des documents, mis en ligne sur la plateforme eCampus, seront disponibles afin de permettre aux participants d'appliquer les techniques vues au cours à l'aide du logiciel R (formation en auto-apprentissage). Les scripts seront fournis ainsi que des explications détaillées sur les inputs/outputs des fonctions exploitées.
Le cours pourrait être enseigné en anglais au cas où des étudiants ne parlant pas français prendraient part à celui-ci.
Lectures recommandées ou obligatoires et notes de cours
Il n'y a pas de notes de cours mais des transparents seront disponibles et diffusés sur eCampus en janvier.
Les participants pourront aussi consulter les livres suivants (disponible en ligne à partir de l'intranet ULiège):
Applied Multivariate Statistical Analysis, RA Johnson et DA Wichern, 6ème édition 2014
Applied Multivariate Statistics with R, D. Zelterman, Springer.
Modalités d'évaluation et critères
Les doctorants qui suivront ce cours de troisième cycle l'auront, pour la plupart, inscrit comme activité dans leur formation doctorale. En fonction des contraintes imposées par les collèges de doctorat correspondants, les possibilités suivantes sont offertes:
- Simple attestation de participation au cours
- Evaluation basée sur un travail personnel d'analyse de données exploitant les techniques vues lors du cours et réalisé soit avec le logiciel R soit avec le logiciel de prédilection de l'étudiant. L'évaluation ne porte pas sur l'utilisation du logiciel mais plutôt sur l'application adéquate des techniques et sur l'interprétation des résultats.
Stage(s)
Remarques organisationnelles
Le cours est repris dans le folder de présentation des activités de formation doctorale réalisé par l'ARD.
Les doctorants qui souhaitent participer au cours doivent s'inscrire via l'ARD.
Par ailleurs, afin de pouvoir accéder aux documents via la plateforme eCampus (transparents, scripts R...), il est plus simple de s'inscrire au cours de formation doctorale SDOC0030 (même si le cours n'est pas repris officiellement dans la formation doctorale).
Le nombre d'inscriptions est limité à 25 et la priorité sera donnée aux doctorants se trouvant dans leurs deux premières années de formation doctorale.
Quelques remarques additionnelles concernant l'organisation:
1) Les présences seront prises lors de chaque demi-journée de cours afin de mesurer le suivi de la fréquentation au cours et afin de pouvoir rédiger les attestations de suivi éventuelles.
2) Si un des étudiants inscrits ne comprend pas le français, le cours sera donné en anglais.
Contacts
G.HAESBROECK, Institut de mathématique, Bât B37, local 0/60, tél: 04/366-95-94, email: G.Haesbroeck@uliege.be