2018-2019 / INFO0953-1

Scripting interfaces for biological software and databases

Durée

20h Th, 50h TD

Nombre de crédits

 Master en bioinformatique et modélisation, à finalité8 crédits 

Enseignant

Denis Baurain, Pierre Tocquin

Coordinateur(s)

Denis Baurain

Langue(s) de l'unité d'enseignement

Langue anglaise

Organisation et évaluation

Enseignement au premier quadrimestre, examen en janvier

Horaire

Horaire en ligne

Unités d'enseignement prérequises et corequises

Les unités prérequises ou corequises sont présentées au sein de chaque programme

Contenus de l'unité d'enseignement

Ce cours enseigne la prise en main du système d'exploitation Linux, la programmation Perl et les concepts-clés des bases de données, dans le contexte des applications bioinformatiques.
1. Linux

  • Linux (installation, configuration et personnalisation, découverte de la GUI)
  • Ligne de commande (terminal, shell)
  • Shell interactif : commandes de diagnostic, de navigation, de recherche de fichiers, de manipulation de fichiers, de lecture/écriture de fichiers, de manipulation de chaînes de caractères et de gestion des permissions
  • Shell avancé : gestion de processus, variables, boucles, one-liners, scripts
  • Tenue d'un cahier de laboratoire bioinformatique
2. Modern Perl
  • Variables (Scalars, Arrays, Hashes)
  • Opérateurs, Expressions booléennes, Contrôle de flux
  • Entrées/Sorties
  • Expressions régulières
  • One-liners
  • Fonctions
  • Références et structures de données enchâssées
  • Modules et Tests unitaires
  • Best of CPAN
  • Perl idiomatique - TIMTOWTDI
3. Bases de données
  • Tables Excel vs Bases de données (non-redondance et cohérence des données)
  • Conception de bases de donnéees : Schéma conceptuel (entités-relations-attributs, cardinalités, conventions de nomenclature) ; Schéma logique (clés primaires, étrangères, candidates et composites, normalisation) ; Schéma physique (db-main, mysql-wb, indexation) ; Concepts avancés (orientation objet, dénormalisation)
  • Exploitation de bases données : Langage SQL (DDL, anatomie du SELECT), SQLite
  • Intégration de SQLite avec le Shell, R et Perl
  • Bases de donnés biologiques
  • Exemple de démarche complète : la base de données MIDI-CHIP

Acquis d'apprentissage (objectifs d'apprentissage) de l'unité d'enseignement

Ce cours est le principal cours de progammation du Master BIM. Avec les autres cours de ce cursus, il vise à ce que les étudiants soient capables d'utiliser l'ordinateur comme un instrument scientifique. Plus spécifiquement, ils auront été formés aux objectifs suivants :
1. Design expérimental

  • comment choisir les contrôles adéquats
  • comment raisonner dans un cadre statistique
2. Réalisation des expériences
  • comment lancer de grandes séries d'analyses
  • comment exploiter la puissance des grilles de calcul
3. Interprétation des résultats
  • comment automatiser l'analyse des fichiers de sortie
  • comment générer des graphes informatifs mais jolis
  • comment tirer des conclusions statistiquement fondées
4. Documentation et archivage
  • comment documenter les protocoles expérimentaux
  • comment réorganiser une série d'analyses a posteriori
  • comment gérer les multiples versions des jeux de données, des programmes utilisés et des résultats générés

Savoirs et compétences prérequis

Ce cours ne suppose aucune connaissance particulière en informatique, mais il s'appuie néanmoins sur les cours de Génomique [GENE0003-1] et de Bioinformatique [BIOL0008-1] du Master BBMC et Master BIM.

Activités d'apprentissage prévues et méthodes d'enseignement

  • mini-exposés théoriques
  • défis à résoudre
  • travaux pratiques sur ordinateur
  • autoformation (manuels et tutoriels en ligne)

Mode d'enseignement (présentiel ; enseignement à distance)

Ce cours est essentiellement en présentiel, mais son approche par problèmes nécessitera du travail en dehors de la salle de classe.

Lectures recommandées ou obligatoires et notes de cours

Les syllabus au format papier seront distribués au cours. Des ouvrages de référence conseillés y seront mentionnés.

Modalités d'évaluation et critères

L'évaluation de ce cours se basera à la fois sur le travail réalisé pendant l'année académique (devoirs : 15%), sur un examen à livre ouvert où un problème intégratif devra être résolu à l'aide de commandes shell et d'un programme Perl (60%), ainsi que sur un travail personnel présentant la démarche de conception et d'exploitation d'une base de données biologique au choix (25%).

Stage(s)

Remarques organisationnelles

La prise de notes sur un ordinateur portable ou une tablette est autorisée. Les étudiants sont néanmoins encouragés à ne pas "surfer" ni "chatter" au cours.

Contacts

Prof. Denis Baurain Institut de Botanique B22 (P70) denis.baurain@uliege.be
Dr. Pierre Tocquin Institut de Botanique B22 (P70) ptocquin@uliege.be
Assistant: Dr. Damien Sirjacobs Institut de Botanique B22 (P70) 04/366.38.54 D.Sirjacobs@uliege.be