Course Syllabus
Obiettivi
L'insegnamento vuole far apprendere a studenti e studentesse come analizzare dati medici (specialmente quelli di cartelle cliniche elettroniche) attraverso tecniche di statistica computazionale e di apprendimento automatico per scoprire nuova conoscenza sulle condizioni dei pazienti.
Contenuti sintetici
Dataset search and retrieval
Data preparation and data cleaning
Exploratory data analysis
Unsupervised machine learning
Supervised machine learning
Feature ranking
Result understanding and validation
R programming language
Programma esteso
Dataset search and retrieval
Data preparation and data cleaning
Exploratory data analysis
Unsupervised machine learning
Supervised machine learning
Feature ranking
Result understanding and validation
R programming language
Prerequisiti
Statistica di base e basi dell'apprendimento automatico
Conoscenza di base di R o Python
Modalità didattica
7 lezioni (ognuna da 2 ore per un totale di 14 ore) di lezione frontale teorica (didattica erogativa)
5 lezioni (4 da due ore ed 1 da un'ora per un totale di 9 ore) di esercitazioni con computer portatile (didattica interattiva)
Materiale didattico
Slides presentate a lezione ed articoli scientifici segnalati a lezione
Periodo di erogazione dell'insegnamento
Secondo semestre
Modalità di verifica del profitto e valutazione
L'esame finale prevede:
1- l'elaborazione d'un progetto scientifico personale, da sviluppare in R analizzando dati medici con le tecniche viste a lezione e durante le esercitazioni;
2- consegna di report sul progetto svolto;
3- presentazione orale del progetto svolto.
Nella componente 1 viene valutata la comprensione dei metodi da parte della studentessa o dello studente, la sua capacità d'applicarli in R a dati reali, e le sue capacità di programmazione.
Nella componente 2 viene valutata la capacità di descrivere il lavoro svolto in un resoconto scritto.
Nella componente 3 viene valutata la capacità di raccontare il lavoro svolto con presentazione orale e slides.
Non sono presenti prove in itinere.
Orario di ricevimento
Da concordare via email scrivendo a davide.chicco(AT)unimib.it
Sustainable Development Goals
Aims
This module aims at teaching students how to analyze medical data (especially, data of electronic health records) through computational statistics and machine learning techniques to infer new knowledge about the conditions of patients.
Contents
Dataset search and retrieval
Data preparation and data cleaning
Exploratory data analysis
Unsupervised machine learning
Supervised machine learning
Feature ranking
Result understanding and validation
R programming language
Detailed program
Dataset search and retrieval
Data preparation and data cleaning
Exploratory data analysis
Unsupervised machine learning
Supervised machine learning
Feature ranking
Result understanding and validation
R programming language
Prerequisites
Basic statistics and basic machine learning
Basic knowledge of R o Python
Teaching form
7 lectures (each of them made of 2 hours for a total of 14) of frontal theory teaching.
5 lectures (4 of two hours and 1 of one hour for a total of 9 hours) of practical excercises on the laptop computer (interactive teaching).
Textbook and teaching resource
Classes slides and scientific papers mentioned during classes
Semester
Second semester
Assessment method
The final exam consists of:
1- The development of a personal scientific project, to be deployed in R analyzing medical data through the techniques learnt during the theoretical classes and during the practical classes;
2- The delivery of a report on the project carried out;
3- An oral presentation of the project carried out.
In the first component, we will assess the student's understanding on the methods, their capability to apply them in R to real medical data, and their programming skills.
In the second component, we will assess the student's capability to describe the project carried out in a written report.
In the third component, we will assess the student's capability to narrate the project carried out through an oral presentation with slides.
There are no mid-term exam tasks.
Office hours
To define via email by writing to davide.chicco(AT)unimib.it