Riassunto di Statistical Learning

Syllabus del corso

Italiano ‎(it)‎
English ‎(en)‎

Esporta

Obiettivi formativi

Il recente sviluppo tecnologico consente agli scienziati e alle aziende di raccogliere sistematicamente dati di elevata complessità e dimensione, tuttavia la metodologia statistica tradizionale può risultare inadeguata ad affrontare le sfide dei big data.

Il corso si pone come obiettivo quello di fornire nuovi strumenti per affrontare l'analisi di dati complessi. Il corso è suddiviso in due parti:

Introduzione al deep learning (3 cfu, Prof. Borrotti)
Inferenza statistica moderna (3 cfu, Prof. Solari)

Lo studente, al termine del corso, avrà perfezionato le abilità di problem solving e di programmazione in R e sarà in grado di utilizzare metodi statistici avanzati per trarre conclusioni sui dati.

Contenuti sintetici

Introduzione al deep learning

Il modulo si pone l’obiettivo di introdurre i concetti fondamentali del deep learning permettendo la loro applicazione consapevole a problemi applicativi.

Inferenza statistica moderna

Il modulo si pone l'obiettivo di introdurre metodi statistici avanzati per affrontare il problema della molteplicità dei test, dell'inferenza post-selezione e dell'inferenza per dati ad elevata dimensionalità.

Programma esteso

Introduzione al deep learning

Introduzione al Deep Learning
Reti Neurali
Reti Neurali Shallow e Deep
Recurrent Neural Network
Convolutional Neural Network

Inferenza moderna

La scienza moderna è in crisi
Il problema della molteplicità dei test
Il problema dell'inferenza post hoc
Il problema dell'inferenza per modelli ad elevata dimensionalità

Prerequisiti

Si consiglia la conoscenza degli argomenti trattati nei corsi Probabilità e Statistica Computazionale M, Statistica Avanzata M e nel modulo Data Mining del corso Data Science M.

Metodi didattici

Le lezioni si svolgono sia in aula che in laboratorio.

Nel periodo di emergenza Covid-19 le lezioni si svolgeranno in modalità da remoto asincrono, eventualmente con eventi in videoconferenza sincrona e/o in presenza fisica.

Modalità di verifica dell'apprendimento

La modalità di verifica si basa su due prove, una per ciascuna parte del corso

Introduzione al deep learning
Inferenza statistica moderna

ed una prova orale finale facoltativa. Il voto complessivo è dato dalla media dei voti delle parti 1. e 2. Qualora lo studente (oppure i docenti) richiedano la prova orale, il voto finale è una media dei voti di scritto e orale.

Introduzione al deep learning

La modalità di verifica consiste nella presentazione di un progetto applicativo concordato con il docente. Il progetto si compone di

Report
File Rmarkdown contenente tutto il codice utilizzato per ottenere i risultati
Slides della presentazione

La presentazione del progetto ha come obiettivo la verifica delle abilità di analisi e di comunicazione dei risultati. Agli studenti frequentanti viene data l’opportunità di svolgere il progetto in gruppi di massimo 4 persone. Gli studenti non frequentanti devono contattare il docente per l'assegnazione del progetto almeno 3 settimane prima della data dell'esame.

Inferenza statistica moderna

La modalità di verifica è suddivisa in due parti:

Homework
Prova orale

Gli homework (parte 1.) devono essere consegnati prima dell'appello d'esame, rispettando le scadenze indicate. Agli studenti frequentanti viene data l'opportunità di svolgere gli homework in gruppi di massimo 3 persone.

La prova orale (parte 2.) comprende domande di teoria e ha come obiettivo la verifica della comprensione degli aspetti matematico-statistici degli argomenti trattati.

Nel periodo di emergenza Covid-19 le prove d'esame saranno solo telematiche. Verranno svolte utilizzando le piattaforme WebEx e Moodle e nella pagina e-learning dell'insegnamento verrà riportato un link pubblico per l'accesso all'esame di possibili spettatori virtuali.

Testi di riferimento

Introduzione al deep learning

D. Efron, T. Hastie (2016) Computer-Age Statistical Inference: Algorithms, Evidence, and Data Science. Cambridge University Press.
Altro materiale

C. M. Bishop (2009) Pattern Recognition And Machine Learning. Springer.
I. Goodfellow, Y. Bengio, A. Courville (2017) Deep Learning. MIT.
F. Chollet, J.J. Allaire (2018) Deep Learning with R. Manning.

Inferenza moderna

Archivio del corso: https://aldosolari.github.io/MI/
Efron, Hastie (2016) Computer-Age Statistical Inference: Algorithms, Evidence, and Data Science. Cambridge University Press
Wainwright (2019) High-Dimensional Statistics: A Non-Asymptotic Viewpoint. Cambridge University Press

Periodo di erogazione dell’insegnamento

Secondo semestre, terzo ciclo.

Lingua di insegnamento

Le lezioni si svolgono in Italiano, tuttavia i libri di testo sono in lingua Inglese.

Esporta

Learning objectives

Recent technological development allows scientists and businesses to systematically collect datasets of high complexity and dimension, however traditional statistical methodology may prove inadequate to face the challenges of big data.

The course aims to provide new tools to address the analysis of complex data. The course is composed by two parts:

Introduction to deep learning (3 cfu, Prof. Borrotti)
Modern statistical inference (3 cfu, Prof. Solari)

At the end of the course, the student will have perfected the problem solving and programming skills and will be able to use advanced statistical methods to draw conclusions on the data.

Introduction to deep learning

The aim is to introduce deep learning both from a theoretical and applied perspective.

Modern inference

The aim is to introduce advanced statistical methods, ranging from classical multiple testing to post-selection inference and high-dimensional inference.

Detailed program

Introduction to deep learning

Introduction to deep learning
Neural network
Shallow and deep neural network
Recurrent neural network
Convolutional neural network

Modern inference

The crisis of modern science
The multiple testing problem
The post-hoc inference problem
The high-dimensional inference problem

Introduction to deep learning
Modern statistical inference

and an optional oral examination. The final grade is the average of the grades obtained in 1. and 2.

Introduction to deep learning

Presentation of a project. The project is composed by

Report
File Rmarkdown including all the code used to generate the results
Slides of the presentation

Attending students can form a team (max. 4 persons)

Modern inference

The exams consists of two parts:

Homework
Oral examination

The final grade is determined by a weighted average of 1. and 2.

Textbooks and Reading Materials

Introduction to deep learning

D. Efron, T. Hastie (2016) Computer-Age Statistical Inference: Algorithms, Evidence, and Data Science. Cambridge University Press.

Supplementary materials:

C. M. Bishop (2009) Pattern Recognition And Machine Learning. Springer.
I. Goodfellow, Y. Bengio, A. Courville (2017) Deep Learning. MIT.
F. Chollet, J.J. Allaire (2018) Deep Learning with R. Manning.

Modern inference

Course repository: https://aldosolari.github.io/MI/
Efron, Hastie (2016) Computer-Age Statistical Inference: Algorithms, Evidence, and Data Science. Cambridge University Press
Wainwright (2019) High-Dimensional Statistics: A Non-Asymptotic Viewpoint. Cambridge University Press

Semester

Second semester, third cycle.

Teaching language

The lessons are held in Italian, but the textbooks are in English.

Entra

Settore disciplinare

SECS-S/01

CFU

Periodo

Annualità Singola

Tipo di attività

Obbligatorio a scelta

Ore

Tipologia CdS

Laurea Magistrale

Iscrizione manuale

Iscrizione spontanea (Studente)

Syllabus del corso

Obiettivi formativi

Contenuti sintetici

Programma esteso

Prerequisiti

Metodi didattici

Modalità di verifica dell'apprendimento

Testi di riferimento

Periodo di erogazione dell’insegnamento

Lingua di insegnamento

Learning objectives

Contents

Detailed program

Prerequisites

Teaching methods

Assessment methods

Textbooks and Reading Materials

Semester

Teaching language

Scheda del corso

Metodi di iscrizione