- Economics
- Bachelor Degree
- Scienze Statistiche ed Economiche [E4103B - E4101B]
- Courses
- A.A. 2025-2026
- 3rd year
- Statistics III
- Summary
Course Syllabus
Obiettivi formativi
Il corso si propone di ampliare e consolidare le conoscenze sui modelli statistici introdotte in Analisi Statistica Multivariata, offrendo una trattazione sistematica dei modelli lineari generalizzati (GLMs). In particolare, gli obiettivi formativi includono:
i. fornire una comprensione avanzata della teoria e delle proprietà dei GLMs;
ii. introdurre le principali tecniche per l’analisi di dati con distribuzioni non gaussiane (es. binomiale, Poisson);
iii. applicare i modelli mediante il software R attraverso esercitazioni pratiche e laboratori;
iv. discutere problematiche reali quali la errata specificazione del modello, l’inferenza basata sulla verosimiglianza e l’uso delle quasi-verosimiglianze.
Il corso contribuisce al raggiungimento degli obiettivi formativi nell’area di apprendimento del CdS: “Statistica”. In particolare, fornisce le conoscenze e competenze per individuare e implementare opportuni modelli statistico-probabilistici e trarre le appropriate conclusioni inferenziali.
Contenuti sintetici
Statistica III è un corso monografico sui modelli lineari generalizzati (Generalized Linear Models, GLMs). Il programma dettagliato è disponibile nella pagina web del corso. Gli argomenti principali sono:
- Modelli lineari: complementi (recap, errata specificazione, robustezza)
- Modelli lineari generalizzati (teoria e metodi)
- Modelli notevoli (regressione binaria e binomiale, regressione di Poisson)
- Quasi-verosimiglianza.
Programma esteso
-
Modelli lineari ed errata specificazione
- Il modello lineare: ripasso e notazione
- Robustezza dello stimatore ai minimi quadrati
- Stimatore sandwich della varianza
- Minimi quadrati pesati
- Trasformazione di Box-Cox, trasformazioni che stabilizzano la varianza
-
Modelli lineari generalizzati (GLM)
- Famiglia di dispersione esponenziale
- Inferenza basata sulla verosimiglianza: stima e verifica d'ipotesi
- Algoritmo IRLS: minimi quadrati pesati ed iterati
- Devianza, diagnostica, analisi dei residui
- Tecniche di selezione del modello
- Implementazione in R
-
Modelli notevoli
- Regression per dati binari e regressione binomiale
- Regressione di Poisson per dati di conteggio
-
Quasi-verosimiglianze
- Ipotesi al second'ordine
- Equazioni di stima non distorte
- Funzione di quasi-verosimiglianza
- Sovradispersione
Prerequisiti
Questo è un corso di livello triennale, ma ci sono alcuni prerequisiti: si assum siano già acquisite conoscenze solide dei seguenti argomenti:
- Regressione lineare semplice e statistica descrittiva, ad esempio da Statistica I;
- Statistica inferenziale, ad esempio da Statistica II;
- Modelli lineari, ad esempio da Analisi Statistica Multivariata e Econometria;
- Software R, ad esempio da Analisi Statistica Multivariata.
Metodi didattici
Le lezioni si svolgono sia in aula che in laboratorio, integrando aspetti di carattere teorico con quelli pratico-applicativi di analisi dei dati e di programmazione in R. Le 47 ore di didattica saranno così suddivise:
- 35 ore di lezione svolte in modalità erogativa in presenza;
- 12 ore di attività di laboratorio.
Modalità di verifica dell'apprendimento
La modalità di verifica si basa su una prova scritta eseguita in laboratorio ed una prova orale (facoltativa).
Nella prova scritta sono previste due sezioni: una costituita da domande teoriche che hanno l’obiettivo di verificare l'acquisizione dei concetti e della formalizzazione necessari per impostare correttamente un modello statistico; la seconda sezione richiede l’analisi di un data set tramite software R. Il voto finale della prova scritta è determinato dalla media dei voti riportati nelle due sezioni. Qualora lo studente (o il docente) richiedano la prova orale, il voto finale è la media dei due voti riportati nelle prove scritta ed orale, altrimenti coincide con l'esito della prova scritta.
Durante la prova non è ammesso l'uso di testi o altro materiale con l'esclusione dei codici che verranno messi a disposizione dal docente all'inizio della prova. Durante la prova non è ammesso l'uso del cellulare.
Testi di riferimento
Riferimenti principali (in italiano)
- Salvan, A., Sartori, N. and L. Pace. 2020. Modelli Lineari Generalizzati. Springer.
- Azzalini, A. 2008. Inferenza Statistica: Una Presentazione Basata sul Concetto di Verosimiglianza. Springer
Approfondimenti (in Inglese)
- Agresti, A. 2015. Foundations of Linear and Generalized Linear Models. Wiley.
- McCullagh, P., and J. A. Nelder. 1989. Generalized Linear Models. Second Edition. Springer.
Ulteriore materiale didattico verrà messo a disposizione nella pagina web del corso.
Periodo di erogazione dell'insegnamento
ll Corso viene erogato nel primo periodo del primo semestre dell'Anno Accademico.
Lingua di insegnamento
Italiano
Sustainable Development Goals
Learning objectives
The course aims to broaden and consolidate the knowledge of statistical models introduced in Multivariate Statistical Analysis, providing a systematic treatment of Generalized Linear Models (GLMs). In particular, the learning objectives include:
i. providing an advanced understanding of the theory and properties of GLMs;
ii. introducing the main techniques for the analysis of data with non-Gaussian distributions (e.g., binomial, Poisson);
iii. applying these models using the R software through practical exercises and labs;
iv. discussing real-world issues such as model misspecification, likelihood-based inference, and the use of quasi-likelihoods.
The course contributes to the achievement of the learning objectives in the study program area of “Statistics.” In particular, it provides the knowledge and skills needed to identify and implement appropriate statistical-probabilistic models and to draw sound inferential conclusions.
Contents
Statistics III is a monographic course on Generalized Linear Models (GLMs). The detailed syllabus is available on the course webpage. The main topics are:
- Linear models: additional topics (recap, misspecification, robustness)
- Generalized linear models: theory and methods
- Important models: binary and binomial regression, Poisson regression
- Quasi-likelihood
Detailed program
-
Linear models and misspecification
- Linear model: review and notation
- Robustness of the least squares estimator
- Sandwich variance estimator
- Weighted least squares
- Box-Cox transformation, variance-stabilizing transformations
-
Generalized linear models (GLM)
- Exponential dispersion family
- Likelihood-based inference: estimation and hypothesis testing
- IRLS algorithm: iteratively reweighted least squares
- Deviance, diagnostics, residual analysis
- Model selection techniques
- Implementation in R
-
Notable models
- Regression for binary and binomial data
- Poisson regression for count data
-
Quasi-likelihood
- Second-order assumptions
- Unbiased estimating equations
- Quasi-likelihood function
- Overdispersion
Prerequisites
This is a B.Sc.-level course, but there are some prerequisites: it is assumed that you have already been exposed to:
- Simple linear regression and descriptive statistics, e.g. from Statistica I;
- Inferential statistics, e.g. from Statistica II;
- Linear models, e.g. from Analisi Statistica Multivariata and Econometria;
- R software, e.g. from Analisi Statistica Multivariata.
Teaching methods
Classes take place both in the classroom and in the computer lab, combining theoretical aspects with practical applications in data analysis and R programming. The 47 hours of teaching are organized as follows:
- 35 hours of lectures delivered in person;
- 12 hours of laboratory activities.
Assessment methods
The assessment consists of a written exam carried out in the computer lab and an oral exam (optional).
The written exam is divided into two sections: the first consists of theoretical questions aimed at verifying the acquisition of concepts and formalization skills necessary to correctly set up a statistical model; the second requires the analysis of a dataset using the R software. The final grade of the written exam is determined by the average of the two section grades. If either the student or the instructor requests an oral exam, the final grade will be the average of the written and oral exam grades; otherwise, it will coincide with the written exam grade.
During the exam, the use of textbooks or other material is not permitted, with the exception of the R scripts made available by the instructor at the beginning of the exam. The use of mobile phones during the exam is strictly prohibited.
Textbooks and Reading Materials
Required (In italian)
- Salvan, A., Sartori, N. and L. Pace. 2020. Modelli Lineari Generalizzati. Springer.
- Azzalini, A. 2008. Inferenza Statistica: Una Presentazione Basata sul Concetto di Verosimiglianza. Springer
Optional
- Agresti, A. 2015. Foundations of Linear and Generalized Linear Models. Wiley.
- McCullagh, P., and J. A. Nelder. 1989. Generalized Linear Models. Second Edition. Springer.
Additional teaching material is made available in the course website.
Semester
The course is scheduled in the first term of the first semester.
Teaching language
Italian
Sustainable Development Goals
Key information
Staff
-
Bernardo Nipoti
-
Tommaso Rigon