- Data Mining M
- Summary
Course Syllabus
Obiettivi formativi
Il corso si pone come obiettivo l'introduzione di tecniche avanzate per l'apprendimento supervisionato (deep learning) e il perfezionamento delle abilità di modellizzazione con finalità previsiva (predictive modelling), con relative implementazioni nell’ambiente di programmazione R. Il corso si divide in due parti:
- Introduction to Deep Learning (3CFU, Prof. Borrotti);
- Applied Predictive Modelling (3CFU, Prof. Solari).
Contenuti sintetici
Il modulo si pone l’obiettivo di introdurre i concetti fondamentali del deep learning permettendo la loro applicazione consapevole a problemi applicativi.
Applied Predictive Modelling
Il modulo si pone l’obiettivo di approfondire il processo di modellizzazione con finalità previsiva. Questo processo include la pre-elaborazione dei dati, la suddivisione in dati di training e di test, la messa a punto dei modelli e la stima delle dell'errore di previsione.
Programma esteso
Introduzione al Deep Learning
Reti Neurali
Reti Neurali Shallow e Deep
Recurrent Neural Network
Convolutional Neural Network
Applied Predictive Modelling
Principi fondamentali: sovra-adattamento, compromesso tra distorsione e varianza, ottimismo
Metodi di ensemble
Il modello e il processo di modellizzazione
Prerequisiti
Si consiglia la conoscenza degli argomenti trattati nei corsi Probabilità e Statistica Computazionale M e Statistica Avanzata M.
Metodi didattici
Le lezioni si svolgono sia in aula che in laboratorio, integrando aspetti di carattere teorico con quelli pratico-applicativi di analisi dei dati e di programmazione in R.
Modalità di verifica dell'apprendimento
Introduction to Deep Learning
La modalità di verifica consiste nella presentazione di un progetto applicativo concordato con il docente. Il progetto si compone di
- Report
- File Rmarkdown contenente tutto il codice utilizzato per ottenere i risultati
- Slides della presentazione
Applied Predictive Modelling
La modalità di verifica consiste nell'analisi di un dataset per il quale bisogna prevedere le osservazioni dei dati di test sulla base dei dati di training. Oltre alle previsioni, bisognerà produrre una relazione contenete la descrizione dell’analisi e il codice utilizzato da consegnare entro la scadenza prevista (almeno una settimana prima dell'appello d'esame). Sarà possibile consegnare le previsioni una volta sola per A.A. Qualora lo studente (oppure il docente) richieda la prova orale, il voto finale è una media dei voti dell'analisi dei dati e della prova orale. L'analisi del dataset ha come obiettivo la verifica delle abilità di modellizzazione dei dati a fini previsivi.
Testi di riferimento
- Efron, Hastie (2016) Computer-Age Statistical Inference: Algorithms, Evidence, and Data Science. Cambridge University Press.
- Bishop (2009) Pattern Recognition And Machine Learning. Springer.
- Goodfellow, Bengio, Courville (2017) Deep Learning. MIT.
- Chollet, Allaire (2018) Deep Learning with R. Manning
- Altro materiale fornito dal docente
Applied Predictive Modelling
- Azzalini, Scarpa (2004). Analisi dei dati e data mining. Springer-Verlag Italia
- Kuhn, Johnson (2019). Feature Engineering and Selection. Chapman and Hall/CRC
- Kuhn, Silge (2021+). Tidy Modeling with R. (in progress)
- Lewis, Kane, Arnold (2019) A Computational Approach to Statistical Learning. Chapman And Hall/Crc.
Periodo di erogazione dell’insegnamento
Primo semestre, secondo periodo.
Lingua di insegnamento
Le lezioni si svolgono in italiano, tuttavia i libri di testo sono in lingua inglese.
Learning objectives
The course aims to provide an introduction to deep learning and to improve predictive modelling skills by using the R software environment for statistical computing. The course is divided in two parts:
- Introduction to Deep Learning (3CFU, Prof. Borrotti);
- Applied Predictive Modelling (3CFU, Prof. Solari).
Contents
Introduction to Deep Learning
TBD
Applied Predictive Modelling
The goal is to elucidate a framework for constructing models that generate accurate predictions. This framework includes pre-processing the data, splitting the data into training and testing sets, selecting an approach for identifying optimal tuning parameters, building models, and estimating predictive performance.
Detailed program
Introduction to Deep Learning
Introduzione al Deep Learning
Reti Neurali
Reti Neurali Shallow e Deep
Recurrent Neural Network
Convolutional Neural Network
Applied Predictive Modelling
Important concepts: overfitting, bias and variance tradeoff, optimism
Ensemble methods
The model and the modelling process
Prerequisites
Knowledge of topics covered in the courses Probability and Statistics M and Advanced Statistics M is highly recommended.
Teaching methods
Lessons are held both in classroom and in lab, integrating theoretical principles with practicals of data analysis and programming in R.
Assessment methods
Introduction to Deep Learning
TBD
Applied Predictive Modelling
Data analysis with the goal of predicting the observations in the test set. In addition to the predictions, a report containing the description of the analysis and the code used must be submitted by the deadline (at least one week before the exam session). It will be possible to submit the predictions only once per Academic Year. If the student (or the teacher) requests the oral exam, the final grade is an average of the marks from the data analysis and the oral exam. The data analysis aims at verifying the predictive modelling skills.
Textbooks and Reading Materials
Introduction to Deep Learning
- Efron, Hastie (2016) Computer-Age Statistical Inference: Algorithms, Evidence, and Data Science. Cambridge University Press.
- Bishop (2009) Pattern Recognition And Machine Learning. Springer.
- Goodfellow, Bengio, Courville (2017) Deep Learning. MIT.
- Chollet, Allaire (2018) Deep Learning with R. Manning
Applied Predictive Modelling
- Azzalini, Scarpa (2004). Analisi dei dati e data mining. Springer-Verlag Italia
- Kuhn, Johnson (2019). Feature Engineering and Selection. Chapman and Hall/CRC
- Kuhn, Silge (2021+). Tidy Modeling with R. (in progress)
- Lewis, Kane, Arnold (2019) A Computational Approach to Statistical Learning. Chapman And Hall/Crc.
Semester
First semester, second period.
Teaching language
The lessons are held in Italian, but the textbooks are in English.
Key information
Staff
-
Matteo Borrotti
-
Aldo Solari