Vai al contenuto principale
Se prosegui nella navigazione del sito, ne accetti le politiche:
  • Condizioni di utilizzo e trattamento dei dati
Prosegui
x
e-Learning - UNIMIB
  • Home
  • My Media
  • Altro
Ascolta questa pagina con ReadSpeaker
Italiano ‎(it)‎
English ‎(en)‎ Italiano ‎(it)‎
 Login
e-Learning - UNIMIB
Home My Media
Percorso della pagina
  1. Area Economico-Statistica
  2. Corso di Laurea Magistrale
  3. Scienze Statistiche ed Economiche [F8206B - F8204B]
  4. Insegnamenti
  5. A.A. 2022-2023
  6. 2° anno
  1. Data Mining M
  2. Introduzione
Insegnamento Titolo del corso
Data Mining M
Codice identificativo del corso
2223-2-F8204B014
Descrizione del corso SYLLABUS

Syllabus del corso

  • Italiano ‎(it)‎
  • English ‎(en)‎
Esporta

Obiettivi formativi

Il corso si pone come obiettivo l'approfondimento di tecniche per l'analisi dei dati e di data mining e il perfezionamento delle abilità di modellizzazione con finalità previsiva, con relative implementazioni nell’ambiente di programmazione R.

Contenuti sintetici

Approfondimento dell'insieme delle metodologie di data mining e dell'apprendimento supervisionato e dei suoi principi generali.
Verrà fornito un quadro del processo di modellizzazione dei dati con finalità previsiva fruibile attraverso R. Questo processo include la pre-elaborazione dei dati, la suddivisione in dati di training e di test, la messa a punto dei modelli e la stima delle dell'errore di previsione.

Programma esteso

  • Principi fondamentali: sovra-adattamento, compromesso tra distorsione e varianza, ottimismo
  • Splines di regressione e modelli addittivi
  • Selezione delle variabili
  • Riduzione della dimensionalità
  • Metodi di ensemble
  • Il modello e il processo di modellizzazione

Prerequisiti

Si consiglia la conoscenza degli argomenti trattati nei corsi Probabilità e Statistica Computazionale M e Statistica Avanzata M.

Metodi didattici

Le lezioni si svolgono sia in aula che in laboratorio, integrando aspetti di carattere teorico con quelli pratico-applicativi di analisi dei dati e di programmazione in R.

Modalità di verifica dell'apprendimento

La modalità di verifica consiste nell'analisi di un dataset e in una prova orale.

L'analisi dei dati ha come obiettivo la verifica delle abilità di modellizzazione dei dati a fini previsivi. La prova orale riguarderà sia l'esposizione dell'analisi dei dati sia la verifica dello studio degli argomenti trattati a lezione.

Per l'analisi dei dati, oltre alle previsioni, bisognerà produrre una relazione contenete la descrizione dell’analisi e il codice utilizzato da consegnare entro la scadenza prevista (almeno una settimana prima dell'appello d'esame). Sarà possibile consegnare le previsioni una volta sola per A.A.

Testi di riferimento

  • Azzalini, Scarpa (2004). Analisi dei dati e data mining. Springer-Verlag Italia
  • Hastie, Tibshirani, Friedman (2009). The Elements of Statistical Learning. Springer

Approfondimenti :

  • Kuhn, Silge (2022). Tidy Modeling with R. O'Reilly Media, Inc.
  • Lewis, Kane, Arnold (2019) A Computational Approach to Statistical Learning. Chapman And Hall/Crc.
  • Kuhn, Johnson (2019). Feature Engineering and Selection. Chapman and Hall/CRC

Periodo di erogazione dell'insegnamento

Primo semestre, secondo periodo.

Lingua di insegnamento

Le lezioni si svolgono in italiano, tuttavia i libri di testo sono in lingua inglese.

Esporta

Learning objectives

The course aims to provide data analysis and data mining tecniques and to improve predictive modelling skills by using the R software environment for statistical computing.

Contents

Study the set of exploitable data mining and supervised learning methods.
Elucidate a framework for constructing models that generate accurate predictions by means of R. This framework includes pre-processing the data, splitting the data into training and testing sets, selecting an approach for identifying optimal tuning parameters, building models, and estimating predictive performance.

Detailed program

  • Important concepts: overfitting, bias and variance tradeoff, optimism
  • Regression splines and additive models
  • Features selection
  • Dimensionality reduction
  • Ensemble methods
  • The model and the modelling process

Prerequisites

Knowledge of topics covered in the courses Probability and Statistics M and Advanced Statistics M is highly recommended.

Teaching methods

Lessons are held both in classroom and in lab, integrating theoretical principles with practicals of data analysis and programming in R.

Assessment methods

The exam consists in a data analysis and an oral examination

The data analysis, in addition to the predictions, requires to submit a report containing the description of the analysis and the code used must be submitted by the deadline (at least one week before the exam session). It will be possible to submit the predictions only once per Academic Year.

Textbooks and Reading Materials

Required

  • Azzalini, Scarpa (2004). Analisi dei dati e data mining. Springer-Verlag Italia
  • Hastie, Tibshirani, Friedman (2009). The Elements of Statistical Learning. Springer

Optional :

  • Kuhn, Silge (2022). Tidy Modeling with R. O'Reilly Media, Inc.
  • Lewis, Kane, Arnold (2019) A Computational Approach to Statistical Learning. Chapman And Hall/Crc.
  • Kuhn, Johnson (2019). Feature Engineering and Selection. Chapman and Hall/CRC

Semester

First semester, second period.

Teaching language

The lessons are held in Italian, but the textbooks are in English.

Entra

Scheda del corso

Settore disciplinare
SECS-S/01
CFU
6
Periodo
Primo Semestre
Tipo di attività
Obbligatorio a scelta
Ore
42
Tipologia CdS
Laurea Magistrale
Lingua
Italiano

Staff

    Docente

  • Aldo Solari
    Aldo Solari

Opinione studenti

Vedi valutazione del precedente anno accademico

Bibliografia

Trova i libri per questo corso nella Biblioteca di Ateneo

Metodi di iscrizione

Iscrizione manuale
Iscrizione spontanea (Studente)

Non sei collegato. (Login)
Politiche
Ottieni l'app mobile
Powered by Moodle
© 2025 Università degli Studi di Milano-Bicocca
  • Privacy
  • Accessibilità
  • Statistiche