- Area Economico-Statistica
- Corso di Laurea Magistrale
- Scienze Statistiche ed Economiche [F8204B]
- Insegnamenti
- A.A. 2020-2021
- 2° anno
- Statistical Learning
- Introduzione
Syllabus del corso
Obiettivi formativi
Il recente sviluppo tecnologico consente agli scienziati e alle aziende di raccogliere sistematicamente dati di elevata complessità e dimensione, tuttavia la metodologia statistica tradizionale può risultare inadeguata ad affrontare le sfide dei big data.
Il corso si pone come obiettivo quello di fornire nuovi strumenti per affrontare l'analisi di dati complessi. Il corso è suddiviso in due parti:
- Introduzione al deep learning (3 cfu, Prof. Borrotti)
- Inferenza statistica moderna (3 cfu, Prof. Solari)
Lo studente, al termine del corso, avrà perfezionato le abilità di problem solving e di programmazione in R e sarà in grado di utilizzare metodi statistici avanzati per trarre conclusioni sui dati.
Contenuti sintetici
Introduzione al deep learning
Il modulo si pone l’obiettivo di introdurre i concetti fondamentali del deep learning permettendo la loro applicazione consapevole a problemi applicativi.
Inferenza statistica moderna
Il modulo si pone l'obiettivo di introdurre metodi statistici avanzati per affrontare il problema della molteplicità dei test, dell'inferenza post-selezione e dell'inferenza per dati ad elevata dimensionalità.
Programma esteso
Introduzione al deep learning
- Introduzione al Deep Learning
- Reti Neurali
- Reti Neurali Shallow e Deep
- Recurrent Neural Network
- Convolutional Neural Network
Inferenza moderna
- La scienza moderna è in crisi
- Il problema della molteplicità dei test
- Il problema dell'inferenza post hoc
- Il problema dell'inferenza per modelli ad elevata dimensionalità
Prerequisiti
Si consiglia la conoscenza degli argomenti trattati nei corsi Probabilità e Statistica Computazionale M, Statistica Avanzata M e nel modulo Data Mining del corso Data Science M.
Metodi didattici
Le lezioni si svolgono sia in aula che in laboratorio.
Nel periodo di emergenza Covid-19 le lezioni si svolgeranno in modalità da remoto asincrono, eventualmente con eventi in videoconferenza sincrona e/o in presenza fisica.
Modalità di verifica dell'apprendimento
La modalità di verifica si basa su due prove, una per ciascuna parte del corso
- Introduzione al deep learning
- Inferenza statistica moderna
ed una prova orale finale facoltativa. Il voto complessivo è dato dalla media dei voti delle parti 1. e 2. Qualora lo studente (oppure i docenti) richiedano la prova orale, il voto finale è una media dei voti di scritto e orale.
Introduzione al deep learning
La modalità di verifica consiste nella presentazione di un progetto applicativo concordato con il docente. Il progetto si compone di
- Report
- File Rmarkdown contenente tutto il codice utilizzato per ottenere i risultati
- Slides della presentazione
La presentazione del progetto ha come obiettivo la verifica delle abilità di analisi e di comunicazione dei risultati. Agli studenti frequentanti viene data l’opportunità di svolgere il progetto in gruppi di massimo 4 persone. Gli studenti non frequentanti devono contattare il docente per l'assegnazione del progetto almeno 3 settimane prima della data dell'esame.
Inferenza statistica moderna
La modalità di verifica è suddivisa in due parti:
- Homework
- Prova orale
Gli homework (parte 1.) devono essere consegnati prima dell'appello d'esame, rispettando le scadenze indicate. Agli studenti frequentanti viene data l'opportunità di svolgere gli homework in gruppi di massimo 3 persone.
La prova orale (parte 2.) comprende domande di teoria e ha come obiettivo la verifica della comprensione degli aspetti matematico-statistici degli argomenti trattati.
Nel periodo di emergenza Covid-19 le prove d'esame saranno solo telematiche. Verranno svolte utilizzando le piattaforme WebEx e Moodle e nella pagina e-learning dell'insegnamento verrà riportato un link pubblico per l'accesso all'esame di possibili spettatori virtuali.
Testi di riferimento
Introduzione al deep learning
- D. Efron, T. Hastie (2016) Computer-Age Statistical Inference: Algorithms, Evidence, and Data Science. Cambridge University Press.
- Altro materiale
- C. M. Bishop (2009) Pattern Recognition And Machine Learning. Springer.
- I. Goodfellow, Y. Bengio, A. Courville (2017) Deep Learning. MIT.
- F. Chollet, J.J. Allaire (2018) Deep Learning with R. Manning.
Inferenza moderna
- Archivio del corso: https://aldosolari.github.io/MI/
- Efron, Hastie (2016) Computer-Age Statistical Inference: Algorithms, Evidence, and Data Science. Cambridge University Press
- Wainwright (2019) High-Dimensional Statistics: A Non-Asymptotic Viewpoint. Cambridge University Press
Periodo di erogazione dell’insegnamento
Secondo semestre, terzo ciclo.
Lingua di insegnamento
Le lezioni si svolgono in Italiano, tuttavia i libri di testo sono in lingua Inglese.
Learning objectives
Recent technological development allows scientists and businesses to systematically collect datasets of high complexity and dimension, however traditional statistical methodology may prove inadequate to face the challenges of big data.
The course aims to provide new tools to address the analysis of complex data. The course is composed by two parts:
- Introduction to deep learning (3 cfu, Prof. Borrotti)
- Modern statistical inference (3 cfu, Prof. Solari)
At the end of the course, the student will have perfected the problem solving and programming skills and will be able to use advanced statistical methods to draw conclusions on the data.
Contents
Introduction to deep learning
The aim is to introduce deep learning both from a theoretical and applied perspective.
Modern inference
The aim is to introduce advanced statistical methods, ranging from classical multiple testing to post-selection inference and high-dimensional inference.
Detailed program
Introduction to deep learning
- Introduction to deep learning
- Neural network
- Shallow and deep neural network
- Recurrent neural network
- Convolutional neural network
Modern inference
- The crisis of modern science
- The multiple testing problem
- The post-hoc inference problem
- The high-dimensional inference problem
Prerequisites
Knowledge of topics covered in the courses Probability and Statistics M, Advanced Statistics M and Data Mining (module of Data Science M) is highly recommended.
Teaching methods
Lessons are taught in classroom and lab
Assessment methods
The exam consists in two parts:
- Introduction to deep learning
- Modern statistical inference
and an optional oral examination. The final grade is the average of the grades obtained in 1. and 2.
Introduction to deep learning
Presentation of a project. The project is composed by
- Report
- File Rmarkdown including all the code used to generate the results
- Slides of the presentation
Attending students can form a team (max. 4 persons)
Modern inference
The exams consists of two parts:
- Homework
- Oral examination
The final grade is determined by a weighted average of 1. and 2.
Textbooks and Reading Materials
Introduction to deep learning
- D. Efron, T. Hastie (2016) Computer-Age Statistical Inference: Algorithms, Evidence, and Data Science. Cambridge University Press.
- C. M. Bishop (2009) Pattern Recognition And Machine Learning. Springer.
- I. Goodfellow, Y. Bengio, A. Courville (2017) Deep Learning. MIT.
- F. Chollet, J.J. Allaire (2018) Deep Learning with R. Manning.
Modern inference
- Course repository: https://aldosolari.github.io/MI/
- Efron, Hastie (2016) Computer-Age Statistical Inference: Algorithms, Evidence, and Data Science. Cambridge University Press
- Wainwright (2019) High-Dimensional Statistics: A Non-Asymptotic Viewpoint. Cambridge University Press
Semester
Second semester, third cycle.
Teaching language
The lessons are held in Italian, but the textbooks are in English.