- Statistical Learning M
- Summary
Course Syllabus
Obiettivi formativi
Il corso si pone come obiettivo l'acquisizione delle principali tecniche di statistical learning (SL) e la loro implementazione nell’ambiente di programmazione R. Durante il corso verrà data particolare enfasi alla algorithmic modeling culture, prestando anche attenzione alla stima dell'incertezza nelle previsioni.
Alla fine del corso lo studente sarà in grado di affrontare applicazioni complesse.
Contenuti sintetici
Algoritmi/modelli: metodi basati sugli alberi.
Previsione: stima dell'incertezza.
Un nuovo paradigma: reinforcement learning.
Un problema in SL: p>>n
Programma esteso
Algoritmi/modelli: metodi basati sugli alberi.
- Alberi decisionali
- Bagging
- Random forests
- Boosting e alberi additivi
- Ensemble learning
Forecasting: uncertainty estimation.
- Conformal prediction: una introduzione
A new paradigm: reinforcement learning.
- Markov decision process
- Policy search
- Q-learning
Un problema in SL: p>>n
- Quando p è molto maggiore di n
- Sure Indipendent Screaning (SIS)
Prerequisiti
Si consiglia la conoscenza degli argomenti trattati negli insegnamenti di “Probabilità e Statistica Computazionale M”, “Statistica
Avanzata M” e del modulo “Data Mining” dell’insegnamento “Data Science M”.
Metodi didattici
Lezioni sfrontali e di laboratorio.
Modalità di verifica dell'apprendimento
Esame scritto.
Testi di riferimento
T. Hastie, R. Tibshirani, J. Friedman (2017) The Elements of Statistical Learning. Springer.
D. Efron, T. Hastie (2016) Computer-Age Statistical Inference: Algorithms, Evidence, and Data Science. Cambridge University Press.
Altro materiale verrà suggerito durante il corso.
Periodo di erogazione dell'insegnamento
Primo semestre, secondo ciclo.
Lingua di insegnamento
Le lezioni saranno svolte in italiano. Il materiale e i libri di testo sono in Inglese.
Le lezioni potranno essere svolte in inglese se si rendesse necessario.
Sustainable Development Goals
Learning objectives
The course aims to acquire the main techniques of statistical learning (SL) and their implementation in the R programming environment. During the course, emphasis will be placed on the algorithmic modelling culture, while also paying attention to the estimation of uncertainty in predictions.
By the end of the course, the student will be able to deal with complex applications.
Contents
Algorithms/models: tree-based methods.
Forecasting: uncertainty estimation.
A new paradigm: reinforcement learning.
An SL problem: p>>n
Detailed program
Algorithms/models: tree-based methods.
- Decision trees
- Bagging
- Random forests
- Boosting and additive trees
- Ensemble learning
Forecasting: uncertainty estimation
- Conformal prediction: an introduction
A new paradigm: reinforcement learning.
- Markov decision process
- Policy search
- Q-learning
An SL problem: p>>n
- When p is much greater than n
- Sure Independent Screaning (SIS)
Prerequisites
Knowledge of topics covered in the courses Probability and Statistics M, Advanced Statistics M and Data Mining (module of Data Science M) is highly recommended.
Teaching methods
Lessons are taught in classroom and lab.
Assessment methods
Written exam.
Textbooks and Reading Materials
T. Hastie, R. Tibshirani, J. Friedman (2017) The Elements of Statistical Learning. Springer.
D. Efron, T. Hastie (2016) Computer-Age Statistical Inference: Algorithms, Evidence, and Data Science. Cambridge University Press.
Further readings will be suggested during the course.
Semester
First semester, second cycle.
Teaching language
The lessons are held in Italian, but the materials and textbooks are in English.
Lessons can be conducted in English if necessary.
Sustainable Development Goals
Key information
Staff
-
Matteo Borrotti