2022-2023 / DATS0001-1

Foundations of data science

Durée

25h Th, 10h Pr, 55h Proj.

Nombre de crédits

 Master en science des données, à finalité5 crédits 
 Master : ingénieur civil en science des données, à finalité5 crédits 

Enseignant

Gilles Louppe

Langue(s) de l'unité d'enseignement

Langue anglaise

Organisation et évaluation

Enseignement au premier quadrimestre, examen en janvier

Horaire

Horaire en ligne

Unités d'enseignement prérequises et corequises

Les unités prérequises ou corequises sont présentées au sein de chaque programme

Contenus de l'unité d'enseignement

The goal of this course is the lay the foundations of data science and to survey Bayesian probabilistic models used for solving data-analysis problems. Our perspective is that models are built iteratively: We build a model, use it to analyze data, assess how it succeeds and fails, revise it, and repeat. 

The table of content will closely follow each step of this loop (tentative and subject to change):

- Lecture 1: Introduction
- Lecture 2: Data representation and manipulation
- Lecture 3: Visualization
- Lecture 4: Probabilistic modelling
- Lecture 5: Approximate Bayesian inference (part 1)
- Lecture 6: Approximate Bayesian inference (part 2)
- Lecture 7: Model criticism
- Lecture 8: Applications
- Lecture 9: Wrap-up case study

 

Acquis d'apprentissage (objectifs d'apprentissage) de l'unité d'enseignement

At the end of the course, the student will have gained the necessary experience, both theoretical and hands-on, for solving data-analysis problems. He/she will have acquired and practised the scientific method at the core of data science, including the representation, manipulation and visualization of the data, the design and use of Bayesian probabilistic models, their iterative criticism and improvement, as well as their applications for answering questions, claiming discoveries or making decisions. 

Savoirs et compétences prérequis

Programming experience. Probability and statistics. Elements of artificial intelligence.

Activités d'apprentissage prévues et méthodes d'enseignement

- Lectures, with live coding sessions
- Reading assignments
- Homeworks

Mode d'enseignement (présentiel, à distance, hybride)

Cours donné exclusivement en présentiel


Explications complémentaires:

Lectures are taught face-to-face. Homeworks are carried out remotely.

Lectures recommandées ou obligatoires et notes de cours

Materials will be made publicly available on GitHub during the semester.

Modalités d'évaluation et critères

Examen(s) en session

Toutes sessions confondues

- En présentiel

évaluation orale

Travail à rendre - rapport


Explications complémentaires:

The evaluation is divided into the following units:

- Homeworks
- Exam (data science study)

Stage(s)

Remarques organisationnelles

The course hub is available at https://github.com/glouppe/dats0001-foundations-of-data-science

Contacts

Gilles Louppe (g.louppe@uliege.be)

Association d'un ou plusieurs MOOCs