Programme des cours 2015-2016
SDOC0030-1  
Statistique multivariée
Durée :
20h Th
Nombre de crédits :
Formation doctorale en sciences (BBMC)3
Formation doctorale en sciences (Biologie des organismes et écologie)3
Formation doctorale en sciences (Chimie)3
Formation doctorale en sciences (Géographie)3
Formation doctorale en sciences (Géologie)3
Formation doctorale en sciences (Mathématiques)3
Formation doctorale en sciences (Océanographie)3
Formation doctorale en sciences (Physique)3
Formation doctorale en sciences (sciences et gestion de l'environnement)3
Formation doctorale en sciences (sciences spatiales)3
Formation doctorale en sciences (didactique des sciences)3
Nom du professeur :
Gentiane Haesbroeck
Langue(s) du cours :
Langue française
Organisation et évaluation :
Enseignement au deuxième quadrimestre
Unités d'enseignement prérequises et corequises :
Les unités prérequises ou corequises sont présentées au sein de chaque programme
Contenus du cours :
Le cours se décompose en deux parties: exposition ex-cathedra de techniques multivariées (12h de cours, voir le détail ci-dessous) et un apprentissage au logiciel R afin d'appliquer ces techniques (8h de cours). Les étudiants qui exploitent déjà un autre logiciel statistique dans le cadre de leurs recherches ne sont pas obligés de suivre la partie du cours consacrée au logiciel R (mais le professeur ne peut pas s'engager à expliquer comment les techniques vues au cours se réalisent dans les autres logiciels).
Lors des cours "théoriques", les quatre thèmes suivants de statistique multivariée sont considérés :
Thème 1: vecteurs moyens, matrices de variances-covariances, distribution multinormale et tests d'inférence classique (tests d'égalité des vecteurs moyens, tests d'homoscédasticité, tests de normalité)
Thème 2: Analyse exploratoire multivariée à l'aide de l'Analyse en Composantes Principales et la classification automatique
Thème 3: Analyse discriminante
Thème 4: Régression multiple et quelques généralisations
Les techniques sont expliquées sans entrer dans le détail des justifications mathématiques.
Acquis d'apprentissage (objectifs d'apprentissage) du cours :
A l'issue de ce cours, les doctorants devront être capables de
- déterminer si une des méthodes vues au cours est appropriée pour analyser un ensemble de données de grande dimension dans leur domaine.
- appliquer la méthode en question.
- interpréter les résultats des analyses effectuées.
Les doctorants seront aussi capables de détecter les situations dans lesquelles les techniques de base ne sont pas applicables (violation des hypothèses de normalité, d'indépendance,...).
Savoirs et compétences prérequis :
Les étudiants doivent avoir déjà suivi un cours de base de statistique descriptive et inférentielle. Les notions suivantes seront exploitées sans être ré-expliquées: paramètres statistiques classiques univariés (moyenne, médiane, quartiles, variance, écart-type, dissymétrie,...), distribution normale univariée, tests d'hypothèse dans le contexte univarié.
Sans une certaine maitrise de ces concepts univariés, les étudiants auront des difficultés pour adapter ceux-ci au contexte multivarié.
Par ailleurs, même si le professeur n'insiste pas sur les justifications mathématiques, certaines notions de base d'algèbre linéaire sont indispensables afin de comprendre les outils principaux de la statistique multivariée (notamment les notions de vecteurs, produits scalaires, matrices, y compris les concepts de matrices inverses et déterminant).
Activités d'apprentissage prévues et méthodes d'enseignement :
12h de cours ex-cathedra
8h de travaux dirigés en salle informatique pour les doctorants souhaitant se familiariser avec le logiciel R
 
 
Mode d'enseignement (présentiel ; enseignement à distance) :
Cetta année, le cours se donnera en présentiel, de façon intensive, selon le calendrier suivant:
Du lundi 25 janvier 2016 au jeudi 28 janvier 2016 (plages horaires: 9h-10h30; 11h-12h30; 13h30-14h30; 15h-16h).
Le matin, le cours se déroulera au local 0/33 de l'Institut de mathématique (B37, Quartier Polytech 1) tandis que les deux heures de cours de l'après-midi (facultatives pur ceux qui ne souhaitent pas apprendre le logiciel R) se dérouleront dans la salle informatique du même bâtiment.
Lectures recommandées ou obligatoires et notes de cours :
Il n'y a pas de notes de cours mais des transparents seront disponibles et diffusés dès le 21 janvier par email aux étudiants inscrits.
 
Modalités d'évaluation et critères :
Les doctorants qui suivront ce cours de troisième cycle l'auront, pour la plupart, inscrit comme activité dans leur formation doctorale. En fonction des contraintes imposées par les collèges de doctorat correspondants, les possibilités suivantes sont offertes:
- Simple attestation de participation à l'ensemble du cours (ou seulement à la partie ex-cathedra de cours)
- Evaluation basée sur un travail personnel d'analyse de données (réalisé soit avec le logiciel R soit avec le logiciel de prédilection de l'étudiant). L'évaluation ne porte pas tant sur l'utilisation du logiciel mais plutôt sur l'application adéquate des techniques et sur l'interprétation des résultats.
Stage(s) :
Remarques organisationnelles :
Le cours est repris dans le folder de présentation des activités de formation doctorale réalisé par l'ARD.
Les doctorants qui souhaitent participer au cours doivent s'inscrire via l'ARD. Les inscriptions seront clôturées le 20 janvier 2016 (des formalités sont en effet nécessaires pour permettre aux étudiants inscrits d'entrer en session sur les ordinateurs de la salle informatique de l'Institut de mathématique).
Les étudiants qui, de plus, souhaitent que le cours fasse officiellement partie de leur formation doctorale doivent également inscrire le cours via l'outil MyULg-Doctorat.
 
Quelques remarques additionnelles concernant l'organisation:
1) Les présences seront prises lors de chaque demi-journée de cours afin de mesurer le suivi de la fréquentation au cours et afin de pouvoir honnêtement rédiger les attestations de suivi éventuelles.
2) L'apprentissage du logiciel R est prévu dans la salle informatique de l'Institut de Mathématique afin que chaque étudiant dispose exactement du même environnement de travail. Les informations utiles au déchargement du logiciel gratuit R et à son installation sur un ordinateur personnel seront données dans le cadre du cours mais le professeur ne s'engage pas à résoudre les problèmes informatiques éventuellement rencontrés sur les ordinateurs personnels.
3) Si un des étudiants inscrits ne comprend pas le français, le cours sera donné en anglais.
Contacts :
G.HAESBROECK, Institut de mathématique, Bât B37, local 0/60, tél: 04/366-95-94, email: G.Haesbroeck@ulg.ac.be