- Statistical Learning M
- Summary
Course Syllabus
Obiettivi formativi
Il corso si pone come obiettivo l'acquisizione delle principali tecniche di statistical learning (SL) e la loro implementazione nell’ambiente di programmazione R. Durante il corso verrà data particolare enfasi alla algorithmic modeling culture, prestando anche attenzione alla stima dell'incertezza nelle previsioni.
Il corso contribuisce al raggiungimento degli obiettivi formativi nell’area di apprendimento del CdS: “Statistica”.
Contenuti sintetici
Gli argomenti principali sono:
- Metodi basati sugli alberi e aspetti computazioni.
- Deep Learning per dati non strutturati.
- Stima dell'incertezza.
Programma esteso
Metodi basati sugli alberi.
- Alberi decisionali: classificazione e regressione.
- Bagging.
- Random forests.
- Boosting e alberi additivi.
- Ensemble learning.
Focus: algoritmo gradient boosting.
**Deep learning
- Neural networks.
- Convolutional neural networks.
- Recurrent neural networks.
Uncertainty estimation.
- Conformal prediction.
Prerequisiti
Si consiglia la conoscenza degli argomenti trattati negli insegnamenti di “Probabilità e Statistica Computazionale M”, “Statistica
Avanzata M” e del modulo “Data Mining” dell’insegnamento “Data Science M”.
Metodi didattici
Le lezioni si svolgono sia in aula che in laboratorio, integrando aspetti di carattere teorico con quelli pratico-applicativi di analisi dei dati e di programmazione in R.
Le 47 ore di didattica saranno così suddivise:
- 35 ore di lezione svolte in modalità erogativa in presenza;
- 12 ore di attività di laboratorio svolte in modalità interattiva da remoto.
Modalità di verifica dell'apprendimento
L'esame si compone di un esame scritto/pratico da svolgere in laboratorio.
(32 punti su 32) Prova scritta a domande aperte e chiuse, in cui vengono valutati gli aspetti teorici del corso. Saranno inoltre presenti domande da svolgere in R.
Testi di riferimento
T. Hastie, R. Tibshirani, J. Friedman (2017) The Elements of Statistical Learning. Springer.
D. Efron, T. Hastie (2016) Computer-Age Statistical Inference: Algorithms, Evidence, and Data Science. Cambridge University Press.
I. Goodfellow, Y. Bengio, A. Courville (2016) Deep Learning. MIT Press.
F. Chollet, J.J. Allaire (2018) Deep Learning with R. Manning.
Altro materiale verrà suggerito durante il corso.
Periodo di erogazione dell'insegnamento
Primo semestre, secondo ciclo.
Lingua di insegnamento
Le lezioni saranno svolte in italiano. Il materiale e i libri di testo sono in Inglese.
Le lezioni potranno essere svolte in inglese se si rendesse necessario.
Sustainable Development Goals
Learning objectives
The course aims to acquire the main techniques of statistical learning (SL) and their implementation in the R programming environment. During the course, emphasis will be placed on the algorithmic modelling culture, while also paying attention to the estimation of uncertainty in predictions.
The course contributes to the achievement of the learning objectives in the subject area of the MSc: "Statistics".
Contents
Main subjects are:
- Tree-based methods and computational aspects.
- Deep Learning for unstructured data.
- Uncertainty estimation.
Detailed program
Tree-based methods.
- Decision trees: classification and regression.
- Bagging.
- Random forests.
- Boosting and additive trees.
- Ensemble learning
Focus: gradient boosting algorithm.
**Deep learning
- Neural networks.
- Convolutional neural networks.
- Recurrent neural networks.
Uncertainty estimation.
- Conformal prediction.
Prerequisites
Knowledge of topics covered in the courses Probability and Statistics M, Advanced Statistics M and Data Mining (module of Data Science M) is highly recommended.
Teaching methods
Lessons are held both in classroom and in lab, integrating theoretical principles with practicals aspects of data analysis and programming in R.
The 47 hours of teaching are organized as follows:
- 35 hours of lectures, in person;
- 12 hours of laboratory activities conducted interactively and remotely.
Assessment methods
The examination consists of a written/practical examination to be conducted in the laboratory.
(32 points out of 32) Written examination with open and closed questions, in which the theoretical aspects of the course are assessed. There will also be questions to be completed in R.
Textbooks and Reading Materials
T. Hastie, R. Tibshirani, J. Friedman (2017) The Elements of Statistical Learning. Springer.
D. Efron, T. Hastie (2016) Computer-Age Statistical Inference: Algorithms, Evidence, and Data Science. Cambridge University Press.
I. Goodfellow, Y. Bengio, A. Courville (2016) Deep Learning. MIT Press.
F. Chollet, J.J. Allaire (2018) Deep Learning with R. Manning.
Further readings will be suggested during the course.
Semester
First semester, second cycle.
Teaching language
The lessons are held in Italian, but the materials and textbooks are in English.
Lessons can be conducted in English if necessary.
Sustainable Development Goals
Key information
Staff
-
Matteo Borrotti