2018-2019 / STAT0750-1

Analyse statistique multivariée (logiciel R)

Durée

10h Th, 10h Pr

Nombre de crédits

 Master en bioinformatique et modélisation, à finalité2 crédits 
 Master en biologie des organismes et écologie, à finalité2 crédits 

Enseignant

Gentiane Haesbroeck

Langue(s) de l'unité d'enseignement

Langue française

Organisation et évaluation

Enseignement au premier quadrimestre, examen en janvier

Horaire

Horaire en ligne

Unités d'enseignement prérequises et corequises

Les unités prérequises ou corequises sont présentées au sein de chaque programme

Contenus de l'unité d'enseignement

Le cours consiste en une introduction générale aux méthodes d'analyse les plus souvent utilisées en statistique multivariée (c'est-à-dire lors de l'étude simultanée de plusieurs variables) dans le domaine de la biologie. Le cours comporte les parties suivantes:
- Représentation graphique des données multivariées
- Tests multivariés
- Techniques exploratoires multivariée: analyse en composantes principales, classification automatique, analyse en coordonnées principales
- Régression multiple et modèle linéaire généralisé

Acquis d'apprentissage (objectifs d'apprentissage) de l'unité d'enseignement

Les méthodes enseignées le sont de façon très pragmatique afin que l'étudiant soit, à la fin du cours, à même de
- poser un problème multivarié,
- réaliser une analyse multivariée classique à l'aide du logiciel R,
- exposer clairement les résultats.
L'étudiant devra aussi être capable de tenir compte des limites d'application des techniques enseignées.

Savoirs et compétences prérequis

Les étudiants doivent avoir suivi un cours de statistique descriptive et inférentielle dans le contexte univarié. Les concepts de distribution normale, d'intervalles de confiance et de tests statistiques seront considérés comme acquis. Par ailleurs, une certaine maitrise du logiciel R est considérée acquise.
La présentation des méthodes est réalisée sans insister sur les justifications mathématiques. Néanmoins, il est impératif que les étudiants maitrisent les concepts suivants: notions de base en algèbre linéaire (vecteurs, matrices, y compris les notions de déterminant et d'inverse), fonctions linéaires, exponentielles et logarithmiques.

Activités d'apprentissage prévues et méthodes d'enseignement

En complément des séances ex-cathedra d'exposition théorique des techniques, les étudiants seront amenés à appliquer celles-ci suivant le shéma d'apprentissage suivant:
- Travail de préparation à domicile en vue de prendre connaissance du "script" préparé par l'équipe encadrante;
- Séance de questions-réponses sur le script et l'interprétation des résultats en salle informatique;
- Devoir personnel à réaliser à domicile (analyses de données à réaliser; des correctifs étant ensuite distribués pour une autoévaluation)

Mode d'enseignement (présentiel ; enseignement à distance)

Le cours compte 20 heures en présentiel. Les séances de cours sont décomposées en des leçons d'enseignement ex-cathédra pour l'exposition de la théorie et en des séances de travaux dirigés en salle informatique. Le planning précis des séances sera mis en ligne sur eCampus dès la rentrée. Les exercices commencés lors des séances de travaux dirigés doivent être terminés à domicile.

Lectures recommandées ou obligatoires et notes de cours

Il n'y a pas de note de cours mais les transparents utilisés lors des séances ex-cathedra seront disponibles à l'avance sur eCampus. Les scripts du logiciel R et les listes d'exercices (et leurs correctifs) seront mis en ligne sur eCampus en fonction de l'évolution de la matière. 
Le livre de référence suivant (dont l'accès en ligne est possible à partir des bibliothèques de l'ULiège) sera suivi pour la plupart des thèmes considérés (ACP, mesures d'associations et analyse en coordonnées principales, régression multiple et modèles de régression généralisé):
A.F. Zuur, E.N. Ieno et G.M. Smith, Analysing ecological data, Springer serie (statistics for biology and health)

Modalités d'évaluation et critères

L'examen se déroule en salle informatique. Des analyses statistiques doivent être réalisées à l'aide du logiciel R et les réponses reproduites par écrit.

Stage(s)

Remarques organisationnelles

Le cours se donne le mardi matin lors du premier quadrimestre au bâtiment B37

Contacts

Enseignant
Gentiane Haesbroeck Département de Mathématique (B37, bureau 0/60) Tél: 04/366.95.94 Email: G. Haesbroeck@ulg.ac.be
Assistant
Marie Ernst Tél: 04/366. 366.94.02  Email: m.ernst@ulg.ac.be