Vai al contenuto principale
Se prosegui nella navigazione del sito, ne accetti le politiche:
  • Condizioni di utilizzo e trattamento dei dati
Prosegui
x
e-Learning - UNIMIB
  • Home
  • My Media
  • Altro
Ascolta questa pagina con ReadSpeaker
Italiano ‎(it)‎
English ‎(en)‎ Italiano ‎(it)‎
 Login
e-Learning - UNIMIB
Home My Media
Percorso della pagina
  1. Area di Scienze
  2. Corso di Laurea Magistrale
  3. Data Science [F9101Q]
  4. Insegnamenti
  5. A.A. 2021-2022
  6. 2° anno
  1. High Dimensional Data Analysis
  2. Introduzione
Insegnamento Titolo del corso
High Dimensional Data Analysis
Codice identificativo del corso
2122-2-F9101Q016
Descrizione del corso SYLLABUS

Syllabus del corso

  • Italiano ‎(it)‎
  • English ‎(en)‎
Esporta

Obiettivi formativi

Questo è un corso avanzato di statistica che ha come oggetto principale l'analisi di dati ad alta dimensionalità. L'obietto del corso è quello di presentare le moderne tecniche di analisi dei dati e la teoria statistica sottostante, coniugando armoniosamente aspetti teorici, pratici e computazionali. 

Contenuti sintetici

Il corso riguarda metodi di regressione e classificazione che possono essere impiegati nel caso di dati ad alta dimensionalità 

Programma esteso

  1. Regressione lineare,  bias/variance trade-off 
  2. Regressione penalizzata, ridge regression e lasso
  3. Sezione del modello, metodi di validazione incrociata
  4. Regressione nonparametrica. k-nearest neighbors (k-NN). Kernel smoothing. Regression splines, Smoothing splines, Local regression

Prerequisiti

Sono necessarie conoscenze di probabilità ed inferenza, algebra lineare, programmazione.

Metodi didattici

Tutte le lezioni si svolgono in laboratorio, integrando aspetti di carattere teorico con quelli computazionali attraverso l'uso di  R.

Modalità di verifica dell'apprendimento

Prova individuale orale su argomenti trattati a lezione. Viene valutata la completezza, la correttezza delle risposte e la proprietà di linguaggio.


Testi di riferimento

    • Materiale didattico fornito dal docente
    • Azzalini, Scarpa (2012) Data analysis and data mining, an introduction . New York: Oxford University Press
    • Gareth, Witten, Hastie, Tibshirani (2014) An Introduction to Statistical Learning, with Applications in R . Springer
    • Hastie, Tibshirani, Friedman (2009) The Elements of Statistical Learning. Data Mining, Inference and Prediction . Springer
    • Hastie, Tibshirani and Wainwright (2015) Statistical Learning with Sparsity: The Lasso and Generalizations . CRC Press

    Periodo di erogazione dell’insegnamento

    Primo Semestre

    Lingua di insegnamento

    Italiano

    Esporta

    Learning objectives

    This is an advanced course focusing on the analysis of high-dimensional data. The goal is to study modern methods and their underlying theory, drawing together theory, data, computation and recent research.

    Contents

    This course covers methods for regression and classification which can be applied to high-dimensional data. 

    Detailed program

    1. Linear regression, bias/variance trade-off 
    2. Regularization, ridge and lasso regression
    3. Model selection, cross-validation
    4. Nonparametric Regression. k-nearest neighbors (k-NN). Kernel smoothing. Regression splines, Smoothing splines, Local regression

    Prerequisites

    Basic knowledge of statistics and probability, linear algebra and computer programming.

    Teaching methods

    Theoretical lessons and computer applications in lab with R software. 


    Assessment methods

    Oral individual exam to assess the theoretical knowledge of the student on the topics presented during the course. The grading is based on the correctness, the completeness of the answers and the appropriateness of language. 


    Textbooks and Reading Materials

    • Lecture notes provided by the instructor
    • Azzalini, Scarpa (2012) Data analysis and data mining, an introduction . New York: Oxford University Press
    • Gareth, Witten, Hastie, Tibshirani (2014) An Introduction to Statistical Learning, with Applications in R . Springer
    • Hastie, Tibshirani, Friedman (2009) The Elements of Statistical Learning. Data Mining, Inference and Prediction . Springer
    • Hastie, Tibshirani and Wainwright (2015) Statistical Learning with Sparsity: The Lasso and Generalizations . CRC Press

    Semester

    First semester 

    Teaching language

    Italian

    Entra

    Scheda del corso

    Settore disciplinare
    SECS-S/03
    CFU
    6
    Periodo
    Primo Semestre
    Tipo di attività
    Obbligatorio a scelta
    Ore
    46
    Lingua
    Italiano

    Staff

      Docente

    • Gianna Serafina Monti
      Gianna Serafina Monti

    Opinione studenti

    Vedi valutazione del precedente anno accademico

    Bibliografia

    Trova i libri per questo corso nella Biblioteca di Ateneo

    Metodi di iscrizione

    Iscrizione manuale
    Iscrizione spontanea (Studente)

    Non sei collegato. (Login)
    Politiche
    Ottieni l'app mobile
    Powered by Moodle
    © 2025 Università degli Studi di Milano-Bicocca
    • Privacy
    • Accessibilità
    • Statistiche