- Area Economico-Statistica
- Corso di Laurea Magistrale
- Scienze Statistiche ed Economiche [F8204B]
- Insegnamenti
- A.A. 2020-2021
- 2° anno
- Statistical Learning M
- Introduzione
Syllabus del corso
Obiettivi formativi
Il recente sviluppo tecnologico consente agli scienziati e alle aziende di raccogliere sistematicamente dati di elevata complessità e dimensione, tuttavia la metodologia statistica tradizionale può risultare inadeguata ad affrontare le sfide dei big data.
Il corso si pone come obiettivo quello di fornire nuovi strumenti per affrontare l'analisi di dati complessi. Il corso è suddiviso in due parti:
- Introduzione al deep learning (3 cfu, Prof. Borrotti)
- Inferenza statistica moderna (3 cfu, Prof. Solari)
Lo studente, al termine del corso, avrà perfezionato le abilità di problem solving e di programmazione in R e sarà in grado di utilizzare metodi statistici avanzati per trarre conclusioni sui dati.
Contenuti sintetici
Introduzione al deep learning
Il modulo si pone l’obiettivo di introdurre i concetti fondamentali del deep learning permettendo la loro applicazione consapevole a problemi applicativi.
Inferenza statistica moderna
Il modulo si pone l'obiettivo di introdurre metodi statistici avanzati per la costruzione di intervalli di previsione non parametrici e quantificare l'incertezza delle procedure di selezione delle variabili.
Programma esteso
Introduzione al deep learning
- Introduzione al Deep Learning
- Reti Neurali
- Reti Neurali Shallow e Deep
- Recurrent Neural Network
- Convolutional Neural Network
Inferenza moderna
- Intervalli di previsione non parametrici
- Il problema della molteplicità dei test
- Il problema della selezione delle variabili
Prerequisiti
Si consiglia la conoscenza degli argomenti trattati nei corsi Probabilità e Statistica Computazionale M, Statistica Avanzata M e nel modulo Data Mining del corso Data Science M.
Metodi didattici
Le lezioni si svolgono sia in aula sia in laboratorio.
Nel periodo di emergenza Covid-19 le lezioni si svolgeranno in modalità da remoto asincrono, eventualmente con eventi in videoconferenza sincrona e/o in presenza fisica.
Modalità di verifica dell'apprendimento
La modalità di verifica si basa su due prove, una per ciascuna parte del corso
- Introduzione al deep learning
- Inferenza statistica moderna
ed una prova orale finale facoltativa. Il voto complessivo è dato dalla media dei voti delle parti 1. e 2. Qualora lo studente (oppure i docenti) richiedano la prova orale, il voto finale è una media dei voti di scritto e orale.
Introduzione al deep learning
La modalità di verifica consiste nella presentazione di un progetto applicativo concordato con il docente. Il progetto si compone di
- Report
- File Rmarkdown contenente tutto il codice utilizzato per ottenere i risultati
- Slides della presentazione
La presentazione del progetto ha come obiettivo la verifica delle abilità di analisi e di comunicazione dei risultati. Agli studenti frequentanti viene data l’opportunità di svolgere il progetto in gruppi di massimo 4 persone. Gli studenti non frequentanti devono contattare il docente per l'assegnazione del progetto almeno 3 settimane prima della data dell'esame.
Inferenza statistica moderna
La modalità di verifica prevede lo svolgimento dell'Analisi dei dati. I risultati dell'Analisi devono essere consegnati almeno tre giorni prima dell'appello d'esame. Lo studente (oppure il docente) può richiedere la prova orale.
Nel periodo di emergenza Covid-19 le prove d'esame saranno solo telematiche. Verranno svolte utilizzando le piattaforme WebEx e Moodle e nella pagina e-learning dell'insegnamento verrà riportato un link pubblico per l'accesso all'esame di possibili spettatori virtuali.
Testi di riferimento
Introduzione al deep learning
- D. Efron, T. Hastie (2016) Computer-Age Statistical Inference: Algorithms, Evidence, and Data Science. Cambridge University Press.
- Altro materiale
- C. M. Bishop (2009) Pattern Recognition And Machine Learning. Springer.
- I. Goodfellow, Y. Bengio, A. Courville (2017) Deep Learning. MIT.
- F. Chollet, J.J. Allaire (2018) Deep Learning with R. Manning.
Inferenza moderna
- Archivio del corso: https://aldosolari.github.io/MI/
- Efron, Hastie (2016) Computer-Age Statistical Inference: Algorithms, Evidence, and Data Science. Cambridge University Press
- Wainwright (2019) High-Dimensional Statistics: A Non-Asymptotic Viewpoint. Cambridge University Press
Periodo di erogazione dell’insegnamento
Secondo semestre, terzo ciclo.
Lingua di insegnamento
Le lezioni si svolgono in Italiano, tuttavia i libri di testo sono in lingua Inglese.
Learning objectives
Recent technological development allows scientists and businesses to systematically collect datasets of high complexity and dimension, however traditional statistical methodology may prove inadequate to face the challenges of big data.
The course aims to provide new tools to address the analysis of complex data. The course is composed by two parts:
- Introduction to deep learning (3 cfu, Prof. Borrotti)
- Modern statistical inference (3 cfu, Prof. Solari)
At the end of the course, the student will have perfected the problem solving and programming skills and will be able to use advanced statistical methods to draw conclusions on the data.
Introduction to deep learning -> During Covid-19 emergency, lessons will be on-line.
Contents
Introduction to deep learning
The aim is to introduce deep learning both from a theoretical and applied perspective.
Modern inference
The aim is to introduce advanced statistical methods, focussing on high-dimensional variable selection and conformal inference.
Detailed program
Introduction to deep learning
- Introduction to deep learning
- Neural network
- Shallow and deep neural network
- Recurrent neural network
- Convolutional neural network
Modern inference
- Conformal inference
- The multiple testing problem
- The variable selection problem
Prerequisites
Knowledge of topics covered in the courses Probability and Statistics M, Advanced Statistics M and Data Mining (module of Data Science M) is highly recommended.
Teaching methods
Lessons are taught in classroom and lab
Assessment methods
The exam consists in two parts:
- Introduction to deep learning
- Modern statistical inference
and an optional oral examination. The final grade is the average of the grades obtained in 1. and 2.
Introduction to deep learning
Presentation of a project. The project is composed by
- Report
- File Rmarkdown including all the code used to generate the results
- Slides of the presentation
Attending students can form a team (max. 4 persons)
Modern inference
The exams consists on Data Analysis.
Textbooks and Reading Materials
Introduction to deep learning
- D. Efron, T. Hastie (2016) Computer-Age Statistical Inference: Algorithms, Evidence, and Data Science. Cambridge University Press.
- C. M. Bishop (2009) Pattern Recognition And Machine Learning. Springer.
- I. Goodfellow, Y. Bengio, A. Courville (2017) Deep Learning. MIT.
- F. Chollet, J.J. Allaire (2018) Deep Learning with R. Manning.
Modern inference
- Course repository: https://aldosolari.github.io/MI/
- Efron, Hastie (2016) Computer-Age Statistical Inference: Algorithms, Evidence, and Data Science. Cambridge University Press
- Wainwright (2019) High-Dimensional Statistics: A Non-Asymptotic Viewpoint. Cambridge University Press
Semester
Second semester, third cycle.
Teaching language
The lessons are held in Italian, but the textbooks are in English.
Scheda del corso
Staff
-
Matteo Borrotti
-
Aldo Solari