Durée
20h Th, 50h TD
Nombre de crédits
| Master en bioinformatique et modélisation, à finalité | 7 crédits |
Enseignant
Tom Druet, Frédéric Farnir, Sébastien Massart, Kristel Van Steen
Coordinateur(s)
Langue(s) de l'unité d'enseignement
Langue anglaise
Organisation et évaluation
Enseignement au deuxième quadrimestre
Horaire
Unités d'enseignement prérequises et corequises
Les unités prérequises ou corequises sont présentées au sein de chaque programme
Contenus de l'unité d'enseignement
Face à la croissance exponentielle de la quantité de données générées dans les sciences de la vie, la bioinformatique occupe maintenant une place centrale dans la recherche et le développement, y compris en agronomie.
L'objectif de ce cours est de développer la capacité d'analyse, l'aptitude à sélectionner et appliquer les algorithmes pertinents par rapport à une question scientifique et l'abilité à expliquer les opérations réalisées et les résultats obtenus auprès de biologistes "non bioinformaticiens". En bref, il s'agit surtout d'apprendre à décoder les besoins exprimés et les questions scientifiques posées de manière à appliquer les codes informatiques les plus pertinents.
Ce cours est basé sur l'apprentissage par projet ou par l'action. A partir d'un problème scientique et de données de séquençage haut-débit, les étudiants devront mettre en place et utiliser un pipeline d'analyse de données. La question scientifique posée visera à comparer les communautés microbiennes présentes dans différents échantillons. Voici un tutoriel d'introduction à cette thématique: https://www.youtube.com/watch?v=6564K4-_DBI
Après une introduction théorique et la mise en contexte du projet, les étudiants recevront des données de séquençage haut-débit de communautés microbiennes ainsi que l'objectif poursuivi pour l'analyse des données.
L'ensemble du cours, orienté développement d'un projet, sera centré sur la sélection, l'application et la documentation d'un pipeline bioinformatique utilisant la suite logiciel QIIME (sous linux, une boite virtuelle sera créée par les étudiants ne travaillant pas sous Linux). Des tutoriels vidéos seront disponibles pour guider les étudiants dans leur démarche et des entretiens avec l'équipe enseignante permettront de guider les étudiants dans leur démarche.
Partie 'Applications en génétique et génomique quantitative; Génomique complexe et systémique':
La seconde partie enseignée par Frédéric Farnir et Tom Druet s'intéresse à des applications en génétique ou génomique quantitative. Le développement des technologies de génotypages et de reséquençage des génomes ont ouvert la voie à de nombreuses études dans les domaines de la génétique des populations ou de la génétique quantitative. Il est possible d'étudier tant les populations d'intérêt agronomique, les organismes modèles que les populations sauvages. Dans cette partie, nous ferons des analyses génomiques sur des données réelles. Ces analyses illustreront l'identification de la structure des populations, l'identification de signatures de sélection, les techniques d'haplotypage et d'imputation de génotypes manquants, l'estimation des relations de parenté et du coefficient de consanguinité, les études d'associations, l'identification de QTL ou de variants associés à des maladies récessives. Cette partie sera organisée en dix séances de 4h avec une première partie présentant les aspects théoriques suivie d'applications sur ordinateur avec des logiciels fréquemment utilisés.
La partie enseignée par Kristel Van Steen présente les composants de la génétique complexe et met en évidence les avantages et les inconvénients des approches de la génétique des systèmes dans le contexte de la santé publique et de la médecine personnalisée.
Acquis d'apprentissage (objectifs d'apprentissage) de l'unité d'enseignement
Les acquis d'apprentissage sont les suivants:
- Capacité à mettre en place un pipeline d'analyse bioinformatique de données de séquençage haut-débit en fonction des questions biologiques posées (transposer une question biologique en analyse bioinformatique utilisant les outils appropriés)
- Aptitude à analyser de manière critique un pipeline bioinformatique
- Capacité à extraire l'information biologique importante à partir de données brutes
- Développer la capacité d'interprétation qualitative et quantitative du "big data"
Pour la seconde partie, les acquis d'apprentissage sont :
- L'acquisition de nouvelles connaissances théoriques en génétique quantitative et génétique des populations telles que les notions de parenté, les modèles pour les études d'association, etc. ;
- L'apprentissage de techniques de modélisation de données génomiques de grande taille;
- La connaissance de logiciels de génétique et la capacité à interpréter les sorties de ces logiciels ;
- Une culture générale des techniques actuellement utilisées en génomique pour l'étude des populations et des caractères complexes.
- Connaissance d'importants concepts et voies d'analyse en génétique des systèmes pour les maladies complexes et en science translationnelle
Savoirs et compétences prérequis
Une bonne connaissance de la biologie moléculaire et des techniques associées (PCR, séquençage,...) est nécessaire.
Une connaissance poussée en bioinformatique ou en language de programmation n'est pas indispensable.
Partie 'Applications en génétique et génomique quantitative'; Génomique complexe et systémique':
Pour la seconde partie les étudiants devront avoir d'une part des connaissances de base en génétique quantitative, génétique des populations et en statistiques et d'autre part pouvoir travailler sous linux et avec R.
Activités d'apprentissage prévues et méthodes d'enseignement
Le cours se développe selon le principe de la classe inversée et de l'apprentissage par l'action. Une introduction générale sera donnée ex-cathedra. Cette introduction permettra d'expliquer le contexte, les objectifs, les modalités d'apprentissage et l'évaluation de ce cours.
Les données brutes à analyser seront également transférées aux étudiants
Des tutoriels en ligne seront ensuite mis à disposition des étudiants et pourront être suivis. Ces tutoriels expliquent la mise en place du pipeline d'analyse bioinformatique ainsi que l'utilité des différentes analyses bioinformatiques à réaliser. Les étudiants devront choisir les analyses les plus pertinentes.
Sur base de ces tutoriels et de recherches personnelles, les étudiants vont mettre en place leur pipeline d'analyse bioinformatique leur permettant d'interpréter les données brutes reçues. Tout au long du développement, les étudiants seront coachés par l'enseignant via des réunions régulières permettant de faire le point, de guider les développements et de résoudre les problèmes rencontrés.
La mise en place du pipeline d'analyse est individuelle mais les étudiants sont également invités à collaborer entre eux (peer learning)
Partie 'Applications en génétique et génomique quantitative'; Génomique complexe et systémique':
L'enseignement se fera dans une salle avec des ordinateurs. Tout d'abord l'enseignant présentera les notions théoriques. Ensuite, les étudiants analyseront des jeux de données réelles avec des logiciels communément utilisés.
Pour le rôle de Kristel Van Steen, les étudiants seront confrontés à des études de cas tirées de la propre expertise du tuteur et de la littérature. Ces études de cas seront discutées en classe et ont pour objectif principal d'améliorer la compréhension des concepts pertinents et de mieux faire connaître les éléments importants de la recherche en génétique complexe.
Mode d'enseignement (présentiel ; enseignement à distance)
- Présentiel: séance d'introduction et coaching reguliers
- A distance: tutoriels on-line et travail personnel sur le projet
L'enseignement se fera en présentiel (parties théoriques) et sous la forme de travaux personnels avec corrections et commentaires des enseignants.
Lectures recommandées ou obligatoires et notes de cours
Sélection de tutoriels vidéo à partir de cette chaine: https://www.youtube.com/channel/UC7QH-fgE50r2mDnkm88fzMg
Partie 'Applications en génétique et génomique quantitative'; Génomique complexe et systémique':
Les enseignants donneront un pdf de leur présentation (type powerpoint). D'éventuelles lectures seront recommandées lors du cours.
Modalités d'évaluation et critères
Les résultats du projet correspondront à l'évaluation.
Plus spécifiquement, la note correspondra à la moyenne entre la documentation du pipeline mis en place (partie documentation bioinformatique) et le rapport d'analyse (traduction des résultats d'analyse bioinformatique en information utilisables par un biologiste).
Un document pdf devra être fourni pour la partie documentation (5 pages maximum) et les résultats seront présentés sous la forme d'un powerpoint (de 6 slides maximum)
Pour la seconde partie, l'évaluation se fera sous la forme d'un examen oral.
Stage(s)
Remarques organisationnelles
Contacts
Analyse de communautés microbiennes à partir de séquences d'ADN: Prof. Sébastien Massart et Mr. Gilles Stouvenakers
Partie 'Applications en génétique et génomique quantitative': Prof. Frédéric Farnir et Dr. Tom Druet
Partie 'Génomique complexe et systémique': Prof Kristel Van Steen
Adaptation des engagements pédagogiques suite à la pandémie de COVID-19 pour la session de mai-juin
Méthodes d'apprentissage mises en uvre : enseignement à distance
Partie du professeur Van Steen - Médecine des systèmes:
- 1er avril (14h-18h): cours interactif en ligne Systems Medicine
- 22 avril (14h-18h): pratique 1 - les étudiants présentent leurs articles choisis; les présentations sont prises comme point de départ pour expliquer plus en détail les concepts pertinents et les applications de pointe de la bioinformatique. En ligne / interactif
- 27 avril (14h-18h): pratique 2 - les étudiants présentent leurs articles choisis; les présentations sont prises comme point de départ pour expliquer plus en détail les concepts pertinents et les applications de pointe de la bioinformatique. En ligne / interactif
Partie du Dr. Druet et du Prof. Farnir
- L'essentiel des enseignements ont été prodigués avant la période de confinement
- Des diaporamas commentés ont été réalisés sur au moins 4 thématiques
- Des exercices ont été partagés
- Des documents décrivant des applications relatives ont différentes applications de génétique quantitative ont été créés et partagés
- Une partie du cours qui n'avait pas été terminée lors du dernier cours en présentiel a été fournie sous la forme d'un syllabus sur le site du cours (avec théorie et applications)
Matière de l'évaluation
Partie du Prof Van Steen - médecine des systèmes
Être capable de traiter la littérature sur les applications de la bioinformatique
en relation avec la médecine des systèmes. Des questions d'orientation sont
fournies.
Partie du Dr. Druet et du Prof. Farnir
Les différentes matières vues au cours sur les méthodes de calcul d'apparentement, de structuration de la population, de cartographie (lignées consanguines, GWAS), d'haplotypage... font partie de la matière à intégrer.
Méthodes d'évaluation
Membre du Prof Van Steen - Systems Medicine
Les travaux pratiques 1 + 2 contribuent à une évaluation permanente. Lignes directrices sur ce qui est évalué et comment a été distribué ("Administration des cours")
Une réflexion écrite combinant les deux travaux pratiques dans une histoire logique sert d'examen écrit
Partie du Dr. Druet et du Prof. Farnir
Un travail individuel sera proposé aux étudiants dans la première quinzaine d'avril. Ce travail est relatif au décryptage d'articles faisant appel aux techniques développées dans cette partie du cours. Une séance de questions/réponses sera organisée en mai pour aider les étudiants dans la rédaction de leur travail (powerpoint) et pour tester la logistique de communication à distance. L'évaluation à proprement parler aura lieu par vidéo-conférence, regroupant les étudiants interrogés et les enseignants.
Contact
Partie du Prof Van Steen - Médecine des systèmes: kristel.vansteen@uliege.be
Partie du Dr. Druet et du Prof. Farnir: tom.druet@uliege.be, f.farnir@uliege.be
Adaptation des engagements pédagogiques suite à la pandémie de COVID-19 pour la session août-sept
Matière de l'évaluation
Partie du Dr. Druet et du Prof. Farnir
Les différentes matières vues au cours sur les méthodes de calcul d'apparentement, de structuration de la population, de cartographie (lignées consanguines, GWAS), d'haplotypage... font partie de la matière à intégrer.
Méthodes d'évaluation (et plateforme utilisée)
Partie S. Massart:
Pour l'examen de seconde session, un travail devra être rendu pour le jour de l'examen au plus tard. Ce travail est toujours ciblé sur les analyses réalisées avec QIIME.
Il contiendra 2 parties:
1. Traçabilité des opérations: les analyses réalisées devront être détaillées dans un document pdf de manière à ce qu'elles puissent être répétées. L'étudiant doit aussi montrer par des explications succinctes qu'il a compris les analyses réalisées
2. Présentation des résultats pour un biologiste: les résultats obtenus doivent être mise en forme dans un rapport sous format pdf à destination d'un biologiste non bioinformaticien. Ils doivent donc être expliqués de manière claire, simple et accessible tout en insistant sur les informations les plus importantes.
Partie du Dr. Druet et du Prof. Farnir
Un travail individuel a été proposé aux étudiants pour la première session. Ce travail est relatif au décryptage d'articles faisant appel aux techniques développées dans cette partie du cours. Une séance de questions/réponses a été organisée en mai pour aider les étudiants dans la rédaction de leur travail (powerpoint) et pour tester la logistique de communication à distance. L'évaluation à proprement parler aura lieu par vidéo-conférence, regroupant les étudiants interrogés et les enseignants.
Contact(s)
Partie du Dr. Druet et du Prof. Farnir
T. Druet (tom.druet@uliege.be)
F. Farnir (f.farnir@uliege.be)