- Area Economico-Statistica
- Corso di Laurea Magistrale
- Scienze Statistiche ed Economiche [F8204B]
- Insegnamenti
- A.A. 2022-2023
- 2° anno
- Statistical Learning M
- Introduzione
Syllabus del corso
Obiettivi formativi
Statistical Learning è un'area della Statistica di recente sviluppo e caratterizzata da forti sovrapposizioni con il Machine Learning. Il corso si pone come obiettivo l'introduzione dei principali metodi di Statistical Learning, discutendone sia gli algoritmi che gli aspetti inferenziali.
Contenuti sintetici
Introduzione a metodi statistici avanzati, in particolare:
- modelli di regressione per dati ad elevata dimensionalità
- procedure di selezione delle variabili con garanzie inferenziali
- intervalli di previsione non-parametrici
Programma esteso
- Prediction, Estimation, and Attribution.
- James-Stein estimation.
- Ridge regression.
- Smoothing splines
- Sparse Modeling: Best Subset and the Lasso
- Data splitting for variable selection.
- Stability selection.
- Knockoff filter.
- Conformal prediction.
Prerequisiti
Si consiglia la conoscenza degli argomenti trattati nei corsi Probabilità e Statistica Computazionale M, Statistica Avanzata M e nel modulo Data Mining del corso Data Science M.
Metodi didattici
Le lezioni si svolgono sia in aula sia in laboratorio.
Modalità di verifica dell'apprendimento
La modalità di verifica consiste in una prova scritta in laboratorio (a libro aperto). Lo studente (oppure il docente) può richiedere la prova orale.
La prova scritta ha come obiettivo la verifica delle abilità di analisi dei dati e di programmazione e la comprensione degli aspetti matematico-statistici degli argomenti trattati.
Testi di riferimento
- Efron, Hastie (2016) Computer-Age Statistical Inference: Algorithms, Evidence, and Data Science. Cambridge University Press
- Hastie, Tibshirani, Friedman (2009). The Elements of Statistical Learning. Springer
Approfondimenti
- Hastie, Tibshirani, Wainwright (2015). Statistical Learning with Sparsity: The Lasso and Generalizations. CRC Press
- Lewis, Kane, Arnold (2019) A Computational Approach to Statistical Learning. Chapman And Hall/Crc.
Periodo di erogazione dell'insegnamento
Secondo semestre, primo periodo.
Lingua di insegnamento
Le lezioni si svolgono in Italiano, i libri di testo sono in lingua Inglese.
Learning objectives
Statistical learning is a recently developed area in statistics and blends with parallel developments in machine learning. The course aims to introduce the main methods of Statistical Learning, discussing both the algorithms and the inferential aspects.
Contents
Introduction to advanced statistical methods, in particular:
- high-dimensional regression
- variable selection with statistical guarantees
- conformal prediction
Detailed program
- Prediction, Estimation, and Attribution.
- James-Stein estimation.
- Ridge regression.
- Smoothing splines
- Sparse Modeling: Best Subset and the Lasso
- Data splitting for variable selection.
- Stability selection.
- Knockoff filter.
- Conformal prediction.
Prerequisites
Knowledge of topics covered in the courses Probability and Statistics M, Advanced Statistics M and Data Mining (module of Data Science M) is highly recommended.
Teaching methods
Lessons are taught in classroom and lab.
Assessment methods
The exam consists in a written exam in lab (open book).
Textbooks and Reading Materials
Main
- Efron, Hastie (2016) Computer-Age Statistical Inference: Algorithms, Evidence, and Data Science. Cambridge University Press
- Hastie, Tibshirani, Friedman (2009). The Elements of Statistical Learning. Springer
Optional
- Hastie, Tibshirani, Wainwright (2015). Statistical Learning with Sparsity: The Lasso and Generalizations. CRC Press
- Lewis, Kane, Arnold (2019) A Computational Approach to Statistical Learning. Chapman And Hall/Crc.
Semester
Second semester, first period.
Teaching language
The lessons are held in Italian, textbooks are in English.