cookieImage
2025-2026 / STAT0077-1

Traitement et analyse informatiques de données biologiques

Durée

25h Th

Nombre de crédits

 Bachelier en sciences biologiques2 crédits 

Enseignant

Patrick Meyer

Langue(s) de l'unité d'enseignement

Langue française

Organisation et évaluation

Enseignement au premier quadrimestre, examen en janvier

Horaire

Horaire en ligne

Unités d'enseignement prérequises et corequises

Les unités prérequises ou corequises sont présentées au sein de chaque programme

Contenus de l'unité d'enseignement

Dans différents domaines de la biologie, l'évolution des technologies aboutit à la production de jeux de données bruts de plus en plus volumineux. Le cours consistera en une découverte de l'utilisation d'outils informatiques et statistiques adaptés pour l'analyse de jeux de données biologiques (le plus souvent des jeux de données d'expressions génétiques).

Diverses notions seront revues par le biais d'exercices, depuis des notions générales (vecteurs et matrices, corrélation, p-valeurs).

Concrètement, le cours sera axé sur l'usage du langage R de base pour traiter des jeux de données biologiques. Le professeur est un des contributeurs de paquetages officiels avec cette vocation depuis 2008. 

L'utilisation d'outils d'intelligence artificielle (LLM) pour l'analyse de données biologiques est aussi abordée dans ce cours.

Acquis d'apprentissage (objectifs d'apprentissage) de l'unité d'enseignement

Réflexes et autonomie pratique nécessaires pour pouvoir aborder le traitement et l'analyse de jeux de données biologiques complexes avec le logiciel R, depuis le chargement de données à partir de différentes sources jusqu'à la synthèse de résultats statistiques et leur visualisation. Capacité à planifier les différentes étapes d'un processus d'analyse de données.

Savoirs et compétences prérequis

Bien que cela ne soit pas indispensable, les étudiants sont invités à revoir les bases qu'ils auraient déjà acquises dans les domaines suivants : statistique et programmation.

 

Activités d'apprentissage prévues et méthodes d'enseignement

Exposés théoriques et travaux pratiques sur ordinateur.

Mode d'enseignement (présentiel, à distance, hybride)

Combinaison d'activités d'apprentissage en présentiel et en distanciel


Informations complémentaires:

La partie théorique du cours est donné en présentiel.

Les exercices eux sont distanciel à travers des vidéos théoriques, des pages web d'exercices pratiques et des vidéos de résolution d'exercices. Les exercices sont en distanciel pour des raisons pédagogiques généralement communiquées lors du premier cours.

Les forums Ecampus permettent des questions-réponses en ligne sur le cours théorique ainsi que sur les exercices pratiques.

Le logiciel RStudio conseillé pour réaliser les exercices est téléchargeable gratuitement sur internet. Quand cela est possible, nous mettons même notre serveur RStudio à disposition des étudiants afin de leur permettre de réaliser leurs exercices et évaluations à travers un simple navigateur web (+vpn si nécessaire). 

Une interro Ecampus peut prendre place pendant l'année. L'interro permet à l'étudiant de comprendre les outils d'évaluation et peut contribuer à la note finale de première session (Les règles relatives aux interros sont bien spécifiées au premier cours et sur la page web du cours). 

Supports de cours, lectures obligatoires ou recommandées

Autre(s) site(s) utilisé(s) pour les supports de cours
- Page web du cours (www.bioinfo.uliege.be/classes/I2BDA/)


Informations complémentaires:

Le cours est disponible en ligne à l'adresse suivante et les mots de passe sont donnés au premier cours ainsi que sur les forums ecampus du cours.

www.bioinfo.uliege.be/classes/I2BDA/



Livre de réference (utile mais non-indispensable):

Getting Started with R: An Introduction for Biologists (Oxford Biology 2012)
by Andrew P. Beckerman and Owen L. Petchey

Modalités d'évaluation et critères

Examen(s) en session

Toutes sessions confondues

- En présentiel

évaluation écrite ( QCM, questions ouvertes )

Interrogation(s) hors session


Informations complémentaires:

Les étudiants sont évalués à travers un examen écrit essentiellement pratique (en salle informatique si possible). Quelques questions théoriques ou de réflexions peuvent aussi être ajoutées à l'examen pratique.

L'examen est écrit (sur machine en général) et il dure deux heures.

Des interros ecampus peuvent prendre place pendant les cours et contribuer à la note finale de première session (les détails de ces interros: lieu, heure, procédure, pondérations... sont communiqués via la page web du cours, ainsi qu'au premier cours).

Le niveau des exercices d'interro et/ou d'examen est proche des exercices d'année les plus difficiles. La plupart des exercices d'année visent principalement à fournir les bases nécessaires pour la réalisation de ces exercices plus avancés.

En cas de seconde session, l'entiereté de la cote se rejoue (il n'y a ni points bonus ni points négatifs résiduels).

Les examens sont des épreuves individuelles (qui ne peuvent pas solliciter d'aide en ligne ou d'aide d'autres étudiants). Sauf mention explicite contraire pendant le cours, aucun outil autre qu'Ecampus et le logiciel R ne sera donc autorisé (ni téléphone, ni calculatrice, ni feuilles de brouillon,...).

 

Stage(s)

Remarques organisationnelles et modifications principales apportées au cours

La partie pratique se fait à distance sur ordinateur personnel (via videos).

La partie théorique est donnée en présentiel.

Contacts

Assistant pour le cours: bioinformatics@uliege.be

 

Prof. Patrick Meyer
Département des Sciences de la Vie


email:  patrick.meyer@uliege.be 

Association d'un ou plusieurs MOOCs