Skip to main content
If you continue browsing this website, you agree to our policies:
  • Condizioni di utilizzo e trattamento dei dati
Continue
x
e-Learning - UNIMIB
  • Home
  • Calendar
  • My Media
  • More
Listen to this page using ReadSpeaker
You are currently using guest access
 Log in
e-Learning - UNIMIB
Home Calendar My Media
Percorso della pagina
  1. Science
  2. Master Degree
  3. Data Science [F9101Q]
  4. Courses
  5. A.A. 2021-2022
  6. 2nd year
  1. Streaming Data Management and Time Series Analysis
  2. Summary
Insegnamento Course full name
Streaming Data Management and Time Series Analysis
Course ID number
2122-2-F9101Q017
Course summary SYLLABUS

Course Syllabus

  • Italiano ‎(it)‎
  • English ‎(en)‎
Export

Obiettivi

Il corso fornisce gli strumenti per gestire, analizzare e prevedere dati in forma di serie storica anche quando generati in tempo reale.

Oltre alle metodologie per la gestione del dato in tempo reale, il corso copre sia modelli lineari (ARIMA, VAR, state-space/filtro di Kalman) sia modelli non lineari (reti neurali,  support vector machine).

Lo studente che avrà seguito l'insegnamento con successo saprà gestire dati in tempo reale, scegliere e identificare il modello di serie storiche più adatto al problema e produrre scomposizioni e previsioni delle serie storiche sotto analisi.

Contenuti sintetici

Gestione dei dati in tempo reale, modelli basati su filtri lineari (ARIMA, VAR), modelli basati su componenti non osservabili (state-space/Kalman filter), modelli non lineari (reti neurali, support vector machine, vicini più vicini).

Programma esteso

Prima parte (Pelagatti)

  • Teoria della previsione statistica (miglior previsore e miglior previsore lineare).
  • Processi stazionari e integrati
  • Modelli ARIMA
  • Modelli VAR e cointegrazione
  • Modelli a componenti non nosservabili (UCM)
  • Forma state-space
  • Kalman filter e stime di massima verosimiglianza di modelli in forma state-space
  • Smoothing delle variabili di stato e dei disturbi (estrazione comonenti e identificazione di anomalie).
  • Molte applicazioni a dati reali usando R e SAS

Seconda parte (Candelieri)

  • La natura delle serie temporali
    • Modalità di rappresentazione: raw data, features extraction, modelling
    • Dati storici versus dati streaming
    • Strumenti di gestione: time series databases
  • Principali task di time-series mining
    • Similarità e Clustering
    • Classificazione, regressione e previsione
  • Approcci non parametrici basati su Machine Learning
    • Reti Neurali
    • Macchine a Vettori di Supporto

Prerequisiti

Per seguire l'insegnamento con successo è necessario conoscere l'inferenza statistica e R.

Modalità didattica

Lezioni teoriche in aula e pratiche in laboratorio informatico. Sarebbe utile se gli studenti portassero con se un computer con installato R anche durante le lezioni in aula.

Materiale didattico

Pelagatti M. (2015) Time Series Modelling with Unobserved Component Models. Chapman and Hall/CRC (il libro è scaricabile gratuitamente sotto indirizzo IP di Bicocca).

Galit Shmueli, Kenneth C. Lichtendahl Jr. “Practical Time Series Forecasting with R: A Hands-On Guide” [2nd Edition] (Practical Analytics) – July 19, 2016

Ulteriore materiale sarà reso disponibile all'interno della piattaforma elearning.

Periodo di erogazione dell'insegnamento

Primo semestre

Modalità di verifica del profitto e valutazione

L'esame è organizzato in due parti. Entro la data dell'esame ciascuno studente dovrà produrre e inviare ai docenti un elaborato dove una o più serie storiche concordate con i docenti dovranno essere analizzate e previste per mezzo di modelli ARIMA, UCM e non-lineari (reti ricorrenti, SVM, ecc.). Lo studente illustrerà l'elaborato durante l'orale e i docenti potranno fare domande sul contenuto. Nel medesimo giorno dell'orale vi è anche uno scritto dalla durata di un'ora che prevede la risposta a cinque domande teoriche su modelli ARIMA e UCM.

Per superare l'esame entrambe le parti dovranno essere sufficienti e il voto finale sarà calcolato come media aritmetica semplice delle votazioni delle due parti.

La valutazione della parte teorica sarà basata sull'esattezza e la completezza delle risposte alle domande proposte (ogni risposta ha lo stesso peso nel voto). La valutazione dell'elaborato sarà basata sulla qualità dei modelli costruiti e, in particolare, sulle features costruite e sulla selezione dei modelli finali.

Orario di ricevimento

Pelagatti: su appuntamento (matteo.pelagatti@unimib.it).

Candelieri: Martedì 10:00-12:00 (U14)

Export

Aims

The course illustretes methods and applications for managing, analysing and forecasting - possibly streaming - time series.

Beside data managing applications, our lessons cover both linear (ARIMA, VAR, state-space/Kalman filter) and nonlinear (neural networks, support vector machine) methods.

The student who succesfully follows this course will be able to manage streaming data and select, identify and implement the time series model fit to the data and the problem under  analysis.

Contents

Streaming data management, linear-filter based models (ARIMA, VAR), unobserved component models (state-space form/Kalman filter), non-linear methods (neural networks, support vector machines, nearest neighbors).

Detailed program

First part (Pelagatti)

  • Theory of statistical prediction (best predictor, best linear predictors).
  • Stationary and integrated processes
  • ARIMA models
  • VAR models and cointegration
  • Unobserved Component Models (UCM)
  • State-space form
  • Kalman filter and maximum likelihood estimation of model in state-space form
  • State and disturbance smoothing
  • Many applications to real data using R and SAS

Second part (Candelieri)

  • Nature of time series data
    • Representing time series: raw data, features extraction, modelling
    • Historical versus streaming data
    • Managing time series data: time series databases
  • Main time series mining tasks
    • Similarity and Clustering
    • Classification, regression and forecasting
  • Non-parametric approaches based on machine Learning
    • Artificial Neural Networks
    • Support Vector Machines


Prerequisites

Attending students should know statistical inference and R.

Teaching form

Theoretical lessons in class and computer applications in lab. It would be helpful if the students could bring their computers (with R installed) also during the lesseons in classroom.

Textbook and teaching resource

Pelagatti M. (2015) Time Series Modelling with Unobserved Component Models. Chapman and Hall/CRC (freely available under Bicocca's IP addresses).

Galit Shmueli, Kenneth C. Lichtendahl Jr. “Practical Time Series Forecasting with R: A Hands-On Guide” [2nd Edition] (Practical Analytics) – July 19, 2016

Further material will be available in the elearning platform.

Semester

First semester

Assessment method

The examination is organized in two parts. By the date of the examination each student has to produce and send to the lecturers a paper in which he/she has to analyze and predict one or more time series (in agreement with the lecturers) using linear (ARIMA, UCM) and non-linear methods (RNN, SVM, etc.). The student will illustrate the paper during the oral examination and the lecturers will ask questions about its content. On the same day of the oral exam, there will be also a one-hour written assessment, which consists in answering to five theoretical questions on ARIMA and UCM models.

In order to pass the exam both parts must have a positive valuation and the final grade will be computed as simple mean of the grades of the two parts.

The evaluation of the theoretical part is based on the exactness and completeness of the answers (each answer is equally weighted). The assessment of the prediction exercise is based on the quality of modelling. We will pay particular attention to feature engineering and model selection procedures.

Office hours

Pelagatti: by appointment (matteo.pelagatti@unimib.it).

Candelieri: Tuesday 10:00-12:00 (U14)


Enter

Key information

Field of research
SECS-S/03
ECTS
6
Term
First semester
Activity type
Mandatory to be chosen
Course Length (Hours)
46
Language
English

Staff

    Teacher

  • Antonio Candelieri
    Antonio Candelieri
  • Matteo Maria Pelagatti
    Matteo Maria Pelagatti

Students' opinion

View previous A.Y. opinion

Bibliography

Find the books for this course in the Library

Enrolment methods

Manual enrolments
Self enrolment (Student)

You are currently using guest access (Log in)
Policies
Get the mobile app
Powered by Moodle
© 2025 Università degli Studi di Milano-Bicocca
  • Privacy policy
  • Accessibility
  • Statistics