Syllabus del corso
Obiettivi formativi
Il corso è offerto per gli studenti iscritti al primo anno della laurea magistrale in Scienze Statistiche ed Economiche (CLAMSES). Nel complesso, il corso contribuisce al raggiungimento degli obiettivi formativi del CdS CLAMSES nell’area di apprendimento della Statistica Economica e della Econometria.
Per gli studenti iscritti a CLAMSES, il corso è erogato coloro che possiedono un background di laurea triennale diverso da quello statistico ed econometrico/economia empirica. Essendo un corso introduttivo, il corso fornisce le conoscenze necessarie per comprendere in maniera adeguata i contenuti di corsi obbligatori erogati nei successivi periodi della LM (es. Serie Storiche Economiche M e Statistica Economica M). Pertanto si consiglia di seguire questo corso prima di frequentare i successivi esami.
Per gli studenti non iscritti a CLAMSES, trattandosi di un corso introduttivo, qualunque studente interessato allo studio delle serie storiche da una prospettiva statistica è invitato a partecipare alle attività e può includerlo nel proprio piano di studi. Essendo un corso di laurea magistrale è comunque richiesto il possesso di una conoscenza basilare della statistica descrittiva, del calcolo delle probabilità, dell'inferenza e dell'algebra lineare. Gli studenti che non possiedono (o che possiedono solo in parte) queste competenze potranno richiedere materiali per il livellamento e il recupero dei contenuti mancanti.
I due principali obiettivi che il corso si pone sono i seguenti:
- Introdurre gli studenti ai fondamenti su modelli di regressione lineare e metodi econometrici per dati temporali;
- Introdurre gli studenti all'analisi delle serie storiche univariate con metodi derivanti dalla statistica-econometria 'classica' e 'moderna'. Nello specifico, partendo dai fondamenti sui processi stocastici a tempo discreto, il corso affronta i temi dell'analisi statistica esplorativa per dati temporali, della identificazione e modellazione delle componenti strutturali (trend, stagionalità, ciclo e break strutturali), modelli Seasonal Auto-Regressive Integrated Moving Average (SARIMA) e modelli di regressione per dati temporali.
Attraverso l'utilizzo di opportuni software statistici, i metodi introdotti durante le lezioni frontali verranno implementati per analizzare dati reali e casi studio empirici con finalità sia interpretative che previsive di fenomeni socio-economici, energetici e ambientali.
La combinazione di nozioni teoriche e di applicazioni empiriche (con software) permetteranno agli studenti di migliorare le proprie competenze analitiche e le conoscenze riguardo a vari contesti applicativi, nonchè la capacità di problem solving di fronte a casi studio reali. In termini di soft skills, gli studenti potranno migliorare la propria capacità critica e di giudizio su problemi reali affiancando conoscenze di contesto (domain knowledge) a conoscenze analitiche attraverso una prospettiva data driven e quantitativa.
Contenuti sintetici
I contenuti sintetici (macro-temi) del corso sono i seguenti:
- Intuizione e concetti chiave sulle serie storiche economiche, sociali, ambientali ed energetiche;
- Introduzione ai processi stocastici per dati temporali
- Introduzione ai modelli di regressione lineare (assunzioni, metodi di stima, interpretazione) con particolare enfasi sui dati temporali
- Analisi esplorativa (EDA) per dati temporali
- Identificazione e modellazione delle componenti strutturali delle serie storiche (decomposizione)
- Modelli Seasonal Auto-Regressive Integrated Moving Average (SARIMA)
Programma esteso
I contenuti dettagliati del corso sono i seguenti:
- Intuzioni e concetti chiave sulle serie storiche economiche (tassonomia dei concetti di serie storiche, componenti osservabili e non osservabili)
- Richiami sui modelli lineari e regressione lineare (Assunzioni e costruzione del Teorema di Gauss-Markov, stima dei parametri con OLSE e MLE, test diagnostici, violazione delle ipotesi, costruzione ragionata di modelli empirici e interpretazione dei risultati)
- Introduzione ai processi stocastici (definizione, proprietà statistiche ed esempi) e richiami di probabilità per le serie storiche: funzioni di autocovarianza e autocorrelazione
- Analisi esplorativa (EDA) per serie storiche: analisi grafica, indici e test sulle caratteristiche dei dati, analisi del trend (modelli lineari parametrici e non parametrici), analisi della stagionalità (regressione armonica), trasformazione di Box-Cox e eteroschedasticità nelle serie storiche
- Stazionarietà, radici unitarie, test Augmented Dickey-Fuller (ADF) e differenziazione
- Decomposizione classica delle serie storiche (modelli additivi e moltiplicativi) e cenni ai metodi di decomposizione istituzionale (es. TRAMO-SEATS)
- Teorema di Wold e genesi di processi AR, MA e ARMA
- Processi stazionari e modelli ARMA: identificazione, stima dei parametri, test diagnostici, teoria della previsione
- Processi integrati e modelli ARIMA
- Processi stagionali e modelli SARIMA
- Modelli di regressione lineare con errori ARIMA (regARIMA)
Prerequisiti
Non ci sono propedeuticità formali, ma è richiesto che lo studente abbia una minima conoscenza di statistica descrittiva, calcolo delle probabilità (variabili casuali), inferenza statistica e algebra lineare (calcolo matriciale).
Metodi didattici
L'insegnamento è da 6 CFU (5 CFU di lezione frontale e 1 CFU di laboratorio), corrispondente a 47 ore di attività così ripartite:
- Didattica frontale (modalità erogativa) in presenza per i contenuti teorici: circa 31 ore
- Laboratorio in presenza con software statistico R per l'analisi di casi studio reali: circa 6 ore
- Laboratorio in remoto sincrono con software statistico R per l'analisi di casi studio reali: circa 10 ore
Modalità di verifica dell'apprendimento
Gli studenti saranno valutati tramite:
- Elaborazione di un progetto individuale che copre la maggior parte degli argomenti affrontati nel corso. Il caso studio su dati empirici reali deve essere concordato (e supervisionato periodicamente) con il docente. Peso: 50% del voto finale.
- Assignment individuale in cui ogni studente deve rispondere a 2 domande teoriche estratte da un pool fornito in precedenza. Le domande saranno svolte senza supervisione (a casa) e saranno poi commentate al momento della prova orale. Peso: 15% del voto finale.
- Prova orale in cui verrà esposto il progetto, le domande dell'assignment e ulteriori domande sui contenuti affrontati nel corso. Peso: 35% del voto finale.
Testi di riferimento
- Slides e materiali del docente
- Libri di testo essenziali
- Per la teoria (con notazione delle slides) sulle serie storiche: "Time series analysis - Univariate and Multivariate Methods" (William W.S., 2006), 2nd ed
- Per gli esempi applicati e richiami di teoria "Forecasting: principles and practice" (Hyndman and Athanasopoulos, 2018), 2nd or 3rd ed
- Per la regressione lineare "Modello Lineare - Teoria e applicazioni con R" (Grigoletto et al., 2017), 1st ed
- Libri di testo di approfondimento
- "Time series analysis and its applications" (Shumway and Stoffer, 2017), 4th ed.
Periodo di erogazione dell'insegnamento
I semestre, II ciclo
Lingua di insegnamento
Italiano
Sustainable Development Goals
Learning objectives
The course is offered to students enrolled in the first year of the Master's Degree in Statistical and Economic Sciences (CLAMSES). The course contributes to the achievement of the educational objectives of the CLAMSES degree program in the area of Economic Statistics and Econometrics.
As this course is designed to serve as an introduction to the subject, it may be appropriate for students interested in pursuing a statistical analysis of time series and who have a fundamental understanding of descriptive statistics, probability calculus, and inference.
For students currently enrolled to CLAMSES: the course is offered to those who have obtained a bachelor's degree in a field other than statistics and econometrics/empirical economics. As an introductory course, it provides the knowledge necessary to adequately understand the content of compulsory courses offered in subsequent periods of the master's program (e.g., Economic Time Series M and Economic Statistics M). Therefore, it is recommended that students complete this course prior to attending subsequent exams.
Students not formally registered in the CLAMSES program are hereby informed that this course is designed to serve as an introductory module on the analysis of time series from a statistical point of view. Prospective participants are encouraged to enroll in the module and to consider incorporating its content as part of their academic program. It should be noted that, given the nature of this course as a master's degree program, prerequisite knowledge of descriptive statistics, probability calculus, inference, and linear algebra is essential. Students who lack these skills, or only possess a subset of them, may request supplementary materials to facilitate their learning and ensure they acquire the necessary competencies.
The two primary objectives of the course are as follows:
- To introduce students to the fundamentals of linear regression models and econometric methods for time series data
- To introduce students to the analysis of univariate time series using methods derived from "classical" and "modern" econometric statistics. The course begins with an examination of the fundamentals of discrete-time stochastic processes and progresses to address the following topics: exploratory statistical analysis for time series data, the identification and modeling of structural components (trends, seasonality, cycles, and structural breaks), Seasonal Auto-Regressive Integrated Moving Average (SARIMA) models, and regression models for time series data.
The methods introduced during the lectures will be applied to analyze real data and empirical case studies for both interpretative and predictive purposes in socio-economic, energy, and environmental phenomena through the use of appropriate statistical software.
The combination of theoretical concepts and empirical applications (with software) will enable students to improve their analytical skills and knowledge of various application contexts, as well as their problem-solving skills when faced with real case studies. With respect to soft skills, students will have the opportunity to enhance their critical and judgmental abilities by integrating their understanding of diverse application contexts with a data-driven and quantitative perspective.
Contents
The summary contents (macro-themes) of the course are as follows:
- Insights and key concepts on economic, social, environmental, and energetic time series
- Introduction to stochastic processes for temporal data
- Introduction to linear regression models (assumptions, estimation methods and interpretation) with emphasis on temporal data
- Exploratory analysis (EDA) for temporal data
- Identification and modeling of time series structural components (decomposition)
- Seasonal Auto-Regressive Integrated Moving Average (SARIMA) models
Detailed program
The detailed contents of the course are as follows:
- Insights and key concepts on economic time series (taxonomy of time series concepts, observable and unobservable components)
- Recalls on linear models and linear regression (Gauss-Markov Theorem, parameter estimation with OLSE/MLE, diagnostic tests and hypothesis violations)
- Introduction to stochastic processes (definition, properties and examples) and recall of probability for time series: autocovariance functions and autocorrelation
- Exploratory analysis (EDA) for time series: graphical analysis, indexes and tests on the characteristics of data, trend analysis (parametric and nonparametric linear models), seasonality analysis (harmonic regression), Box-Cox transformation and heteroschedasticity in time series
- Stationarity, unit roots, ADF tests, differentiation
- Classical decomposition of time series: additive and multiplicative models
- Wold's theorem and genesis of AR, MA and ARMA processes.
- Stationary processes and ARMA models: identification, parameter estimation, diagnostic tests, prediction theory
- Integrated processes and ARIMA models.
- Seasonal processes and SARIMA models.
- Linear regression models with ARIMA errors (regARIMA).
Prerequisites
There are no formal prerequisites, but it is expected that the student possesses a minimum knowledge of descriptive statistics, probability calculus (random variables), statistical inference and linear algebra (matrix calculus).
Teaching methods
The course provides 6 ECTS (of which, 5 are frontal teaching and 1 laboratory), corresponding to 47 hours sudvided as follows:
- In-presence frontal teaching (modalità erogativa) for theoretical content: about 31 hours
- In-presence laboratory class with R statistical software for the analysis of real case studies: about 6 hours
- Remote (syncro) laboratory class with R statistical software for the analysis of real case studies: about 10 hours
Assessment methods
Students will be evaluated by:
- Development of an individual project covering most of the topics covered in the course. The case study on real empirical data should be coordinated (and periodically validated) with the lecturer. Weight: 50% of the final grade.
- Individual Assignment in which each student must answer 2 theoretical questions drawn from a pre-defined pool. The questions will be completed unsupervised (at home) and will then be commented on at the oral exam. Weight: 15% of the final grade.
- Oral examination in which the project, assignment questions, and additional questions on the content covered in the course will be exposed. Weight: 35% of the final grade.
Textbooks and Reading Materials
- Slides and further materials from the lecturer
- Essential textbooks
- Theory (with same notation used in the slides) on time series: "Time series analysis - Univariate and Multivariate Methods" (William W.S., 2006), 2nd ed
- Applications with R and recall on theory: "Forecasting: principles and practice" (Hyndman and Athanasopoulos, 2018), 2nd or 3rd ed
- Linear regression and linear models: "Modello Lineare - Teoria e applicazioni con R" (Grigoletto et al., 2017), 1st ed
- Adavanced textbooks
- "Time series analysis and its applications" (Shumway and Stoffer, 2017), 4th ed.
Semester
I semester, II cycle
Teaching language
Italian
Sustainable Development Goals
Scheda del corso
Staff
-
Paolo Maranzano