Skip to main content
If you continue browsing this website, you agree to our policies:
  • Condizioni di utilizzo e trattamento dei dati
Continue
x
e-Learning - UNIMIB
  • Home
  • My Media
  • More
Listen to this page using ReadSpeaker
English ‎(en)‎
English ‎(en)‎ Italiano ‎(it)‎
 Log in
e-Learning - UNIMIB
Home My Media
Percorso della pagina
  1. Economics
  2. Master Degree
  3. Scienze Statistiche ed Economiche [F8206B - F8204B]
  4. Courses
  5. A.A. 2022-2023
  6. 2nd year
  1. Data Mining M
  2. Summary
Insegnamento Course full name
Data Mining M
Course ID number
2223-2-F8204B014
Course summary SYLLABUS

Course Syllabus

  • Italiano ‎(it)‎
  • English ‎(en)‎
Export

Obiettivi formativi

Il corso si pone come obiettivo l'approfondimento di tecniche per l'analisi dei dati e di data mining e il perfezionamento delle abilità di modellizzazione con finalità previsiva, con relative implementazioni nell’ambiente di programmazione R.

Contenuti sintetici

Approfondimento dell'insieme delle metodologie di data mining e dell'apprendimento supervisionato e dei suoi principi generali.
Verrà fornito un quadro del processo di modellizzazione dei dati con finalità previsiva fruibile attraverso R. Questo processo include la pre-elaborazione dei dati, la suddivisione in dati di training e di test, la messa a punto dei modelli e la stima delle dell'errore di previsione.

Programma esteso

  • Principi fondamentali: sovra-adattamento, compromesso tra distorsione e varianza, ottimismo
  • Splines di regressione e modelli addittivi
  • Selezione delle variabili
  • Riduzione della dimensionalità
  • Metodi di ensemble
  • Il modello e il processo di modellizzazione

Prerequisiti

Si consiglia la conoscenza degli argomenti trattati nei corsi Probabilità e Statistica Computazionale M e Statistica Avanzata M.

Metodi didattici

Le lezioni si svolgono sia in aula che in laboratorio, integrando aspetti di carattere teorico con quelli pratico-applicativi di analisi dei dati e di programmazione in R.

Modalità di verifica dell'apprendimento

La modalità di verifica consiste nell'analisi di un dataset e in una prova orale.

L'analisi dei dati ha come obiettivo la verifica delle abilità di modellizzazione dei dati a fini previsivi. La prova orale riguarderà sia l'esposizione dell'analisi dei dati sia la verifica dello studio degli argomenti trattati a lezione.

Per l'analisi dei dati, oltre alle previsioni, bisognerà produrre una relazione contenete la descrizione dell’analisi e il codice utilizzato da consegnare entro la scadenza prevista (almeno una settimana prima dell'appello d'esame). Sarà possibile consegnare le previsioni una volta sola per A.A.

Testi di riferimento

  • Azzalini, Scarpa (2004). Analisi dei dati e data mining. Springer-Verlag Italia
  • Hastie, Tibshirani, Friedman (2009). The Elements of Statistical Learning. Springer

Approfondimenti :

  • Kuhn, Silge (2022). Tidy Modeling with R. O'Reilly Media, Inc.
  • Lewis, Kane, Arnold (2019) A Computational Approach to Statistical Learning. Chapman And Hall/Crc.
  • Kuhn, Johnson (2019). Feature Engineering and Selection. Chapman and Hall/CRC

Periodo di erogazione dell'insegnamento

Primo semestre, secondo periodo.

Lingua di insegnamento

Le lezioni si svolgono in italiano, tuttavia i libri di testo sono in lingua inglese.

Export

Learning objectives

The course aims to provide data analysis and data mining tecniques and to improve predictive modelling skills by using the R software environment for statistical computing.

Contents

Study the set of exploitable data mining and supervised learning methods.
Elucidate a framework for constructing models that generate accurate predictions by means of R. This framework includes pre-processing the data, splitting the data into training and testing sets, selecting an approach for identifying optimal tuning parameters, building models, and estimating predictive performance.

Detailed program

  • Important concepts: overfitting, bias and variance tradeoff, optimism
  • Regression splines and additive models
  • Features selection
  • Dimensionality reduction
  • Ensemble methods
  • The model and the modelling process

Prerequisites

Knowledge of topics covered in the courses Probability and Statistics M and Advanced Statistics M is highly recommended.

Teaching methods

Lessons are held both in classroom and in lab, integrating theoretical principles with practicals of data analysis and programming in R.

Assessment methods

The exam consists in a data analysis and an oral examination

The data analysis, in addition to the predictions, requires to submit a report containing the description of the analysis and the code used must be submitted by the deadline (at least one week before the exam session). It will be possible to submit the predictions only once per Academic Year.

Textbooks and Reading Materials

Required

  • Azzalini, Scarpa (2004). Analisi dei dati e data mining. Springer-Verlag Italia
  • Hastie, Tibshirani, Friedman (2009). The Elements of Statistical Learning. Springer

Optional :

  • Kuhn, Silge (2022). Tidy Modeling with R. O'Reilly Media, Inc.
  • Lewis, Kane, Arnold (2019) A Computational Approach to Statistical Learning. Chapman And Hall/Crc.
  • Kuhn, Johnson (2019). Feature Engineering and Selection. Chapman and Hall/CRC

Semester

First semester, second period.

Teaching language

The lessons are held in Italian, but the textbooks are in English.

Enter

Key information

Field of research
SECS-S/01
ECTS
6
Term
First semester
Activity type
Mandatory to be chosen
Course Length (Hours)
42
Degree Course Type
2-year Master Degreee
Language
Italian

Staff

    Teacher

  • Aldo Solari
    Aldo Solari

Students' opinion

View previous A.Y. opinion

Bibliography

Find the books for this course in the Library

Enrolment methods

Manual enrolments
Self enrolment (Student)

You are not logged in. (Log in)
Policies
Get the mobile app
Powered by Moodle
© 2025 Università degli Studi di Milano-Bicocca
  • Privacy policy
  • Accessibility
  • Statistics