2018-2019 / INFO0955-1

Bioinformatics applications : Case studies in veterinary and agronomical sciences

Durée

20h Th, 50h TD

Nombre de crédits

 Master en bioinformatique et modélisation, à finalité7 crédits 

Enseignant

Tom Druet, Frédéric Farnir, Sébastien Massart

Coordinateur(s)

Sébastien Massart

Langue(s) de l'unité d'enseignement

Langue anglaise

Organisation et évaluation

Enseignement au deuxième quadrimestre

Horaire

Horaire en ligne

Unités d'enseignement prérequises et corequises

Les unités prérequises ou corequises sont présentées au sein de chaque programme

Contenus de l'unité d'enseignement

Face à la croissance exponentielle de la quantité de données générées dans les sciences de la vie, la bioinformatique occupe maintenant une place centrale dans la recherche et le développement, y compris en agronomie.
L'objectif de ce cours est de développer la capacité d'analyse, l'aptitude à sélectionner et appliquer les algorithmes pertinents par rapport à une question scientifique et l'abilité à expliquer les opérations réalisées et les résultats obtenus auprès de biologistes "non bioinformaticiens". En bref, il  s'agit surtout d'apprendre à décoder les besoins exprimés et les questions scientifiques posées de manière à appliquer les codes informatiques les plus pertinents.
Ce cours est basé sur l'apprentissage par projet ou par l'action. A partir d'un problème scientique et de données de séquençage haut-débit, les étudiants devront mettre en place et utiliser un pipeline d'analyse de données. La question scientifique posée visera à comparer les communautés microbiennes présentes dans différents échantillons. Voici un tutoriel d'introduction à cette thématique: https://www.youtube.com/watch?v=6564K4-_DBI
Après une introduction théorique et la mise en contexte du projet, les étudiants recevront des données de séquençage haut-débit de communautés microbiennes ainsi que l'objectif poursuivi pour l'analyse des données.
L'ensemble du cours, orienté développement d'un projet, sera centré sur la sélection, l'application et la documentation d'un pipeline bioinformatique utilisant la suite logiciel QIIME (sous linux, une boite virtuelle sera créée par les étudiants ne travaillant pas sous Linux). Des tutoriels vidéos seront disponibles pour guider les étudiants dans leur démarche et des entretiens avec l'équipe enseignante permettront de guider les étudiants dans leur démarche.
Partie 'Applications en génétique et génomique quantitative':
La seconde partie enseignée par Frédéric Farnir et Tom Druet s'intéresse à des applications en génétique ou génomique quantitative. Le développement des technologies de génotypages et de reséquençage des génomes ont ouvert la voie à de nombreuses études dans les domaines de la génétique des populations ou de la génétique quantitative. Il est possible d'étudier tant les populations d'intérêt agronomique, les organismes modèles que les populations sauvages. Dans cette partie, nous ferons des analyses génomiques sur des données réelles. Ces analyses illustreront l'identification de la structure des populations, l'identification de signatures de sélection, les techniques d'haplotypage et d'imputation de génotypes manquants, l'estimation des relations de parenté et du coefficient de consanguinité, les études d'associations, l'identification de QTL ou de variants associés à des maladies récessives. Cette partie sera organisée en dix séances de 4h avec une première partie présentant les aspects théoriques suivie d'applications sur ordinateur avec des logiciels fréquemment utilisés.

 

Acquis d'apprentissage (objectifs d'apprentissage) de l'unité d'enseignement

Les acquis d'apprentissage sont les suivants:

  • Capacité à mettre en place un pipeline d'analyse bioinformatique de données de séquençage haut-débit en fonction des questions biologiques posées (transposer une question biologique en analyse bioinformatique utilisant les outils appropriés)
  • Aptitude à analyser de manière critique un pipeline bioinformatique
  • Capacité à extraire l'information biologique importante à partir de données brutes
  • Développer la capacité d'interprétation qualitative et quantitative du "big data"
Partie 'Applications en génétique et génomique quantitative':
Pour la seconde partie, les acquis d'apprentissage sont :
  • L'acquisition de nouvelles connaissances théoriques en génétique quantitative et génétique des populations telles que les notions de parenté, les modèles pour les études d'association, etc. ;
  • L'apprentissage de techniques de modélisation de données génomiques de grande taille;
  • La connaissance de logiciels de génétique  et la capacité à interpréter les sorties de ces logiciels ;
  • Une culture générale des techniques actuellement utilisées en génomique pour l'étude des populations et des caractères complexes.

Savoirs et compétences prérequis

Une bonne connaissance de la biologie moléculaire et des techniques associées (PCR, séquençage,...) est nécessaire.
Une connaissance poussée en bioinformatique ou en language de programmation n'est pas indispensable.
 
Partie 'Applications en génétique et génomique quantitative':
Pour la seconde partie les étudiants devront avoir d'une part des connaissances de base en génétique quantitative, génétique des populations et en statistiques et d'autre part pouvoir travailler sous linux et avec R.

Activités d'apprentissage prévues et méthodes d'enseignement

Le cours se développe selon le principe de la classe inversée et de l'apprentissage par l'action. Une introduction générale sera donnée ex-cathedra. Cette introduction permettra d'expliquer le contexte, les objectifs, les modalités d'apprentissage et l'évaluation de ce cours.
Les données brutes à analyser seront également transférées aux étudiants
Des tutoriels en ligne seront ensuite mis à disposition des étudiants et pourront être suivis. Ces tutoriels expliquent  la mise en place du pipeline d'analyse bioinformatique ainsi que l'utilité des différentes analyses bioinformatiques à réaliser. Les étudiants devront choisir les analyses les plus pertinentes.
Sur base de ces tutoriels et de recherches personnelles, les étudiants vont mettre en place leur pipeline d'analyse bioinformatique leur permettant d'interpréter les données brutes reçues. Tout au long du développement, les étudiants seront coachés par l'enseignant via des réunions régulières permettant de faire le point, de guider les développements et de résoudre les problèmes rencontrés.
La mise en place du pipeline d'analyse est individuelle mais les étudiants sont également invités à collaborer entre eux (peer learning)
Partie 'Applications en génétique et génomique quantitative':
L'enseignement se fera dans une salle avec des ordinateurs. Tout d'abord l'enseignant présentera les notions théoriques. Ensuite, les étudiants analyseront des jeux de données réelles avec des logiciels communément utilisés.
 

Mode d'enseignement (présentiel ; enseignement à distance)

  • Présentiel: séance d'introduction et coaching reguliers
  • A distance: tutoriels on-line et travail personnel sur le projet
Partie 'Applications en génétique et génomique quantitative':
L'enseignement se fera en présentiel (parties théoriques) et sous la forme de travaux personnels avec corrections et commentaires des enseignants.

Lectures recommandées ou obligatoires et notes de cours

Sélection de tutoriels vidéo à partir de cette chaine: https://www.youtube.com/channel/UC7QH-fgE50r2mDnkm88fzMg
 Partie 'Applications en génétique et génomique quantitative':
Les enseignants donneront un pdf de leur présentation (type powerpoint). D'éventuelles lectures seront recommandées lors du cours.

Modalités d'évaluation et critères

Les résultats du projet correspondront à l'évaluation. 
Plus spécifiquement, la note correspondra à la moyenne entre la documentation du pipeline mis en place (partie documentation bioinformatique) et le rapport d'analyse (traduction des résultats d'analyse bioinformatique en information utilisables par un biologiste).
Un document pdf devra être fourni pour la partie documentation (5 pages maximum) et les résultats seront présentés sous la forme d'un powerpoint (de 6 slides maximum)
Pour la seconde partie, l'évaluation se fera sous la forme d'un examen oral.

Stage(s)

Remarques organisationnelles

Contacts

Analyse de communautés microbiennes à partir de séquences d'ADN: Prof. Sébastien Massart et Mr. Gilles Stouvenakers
Partie 'Applications en génétique et génomique quantitative': Prof. Frédéric Farnir et Dr. Tom Druet