Given the abundance of teaching material uploaded on the e-learning platform of the course, no distinction is made between exams for attending students and exams for non-attending students.
Course Syllabus
Obiettivi formativi
Il corso ha quale obiettivo la trattazione dei modelli lineari per dati categoriali secondo due diverse impostazioni. La prima riguarda il modello lineare generale (GLM), in particolare i modelli ANOVA ad una o più vie e il modello ANCOVA. La seconda impostazione riguarda i modelli lineari generalizzati, in particolare il modello log-lineare di Poisson per dati di conteggio e il modello logistico binomiale, in un’ottica di GLM. L’analisi dei casi empirici è svolta con il software SAS.
Contenuti sintetici
Modello lineare generale (GLM), modello ANOVA a una e
più vie e modello ANCOVA. Modelli lineari generalizzati (GzLM), modello
logistico binomiale e modello log-lineare di Poisson. Applicazioni a dati reali
e sperimentali con il software SAS.
Programma esteso
- La teoria del modello lineare generale (GLM):
specificazione del modello, inversa generalizzata, funzioni stimabili, ipotesi
testabili. Relazione con il metodo di stima dei minimi quadrati vincolati:
approcci sum-to-zero e set-to-zero linear constraints.
Parametrizzazione degli effetti e della categoria di riferimento. Contrasti
- Casi particolari di GLM: modelli ANOVA ad effetti
fissi a una e a più vie, modello ANCOVA. PROC GLM di SAS
- Selezione del GLM: metodi forward e stepwise. PROC
GLMSELECT di SAS
- Modelli lineari generalizzati (GzLM): legge di
distribuzione della variabile risposta, funzione link, specificazione del
modello, metodo di stima di massima verosimiglianza, proprietà degli stimatori,
bontà di adattamento del modello, intervalli di confidenza e verifica di
ipotesi
- Casi particolari di
GzLM: modello log-lineare di Poisson per dati di conteggio e modello logistico
binomiale, in un’ottica di GLM. PROC GENMOD di SAS
Prerequisiti
Per questa attività formativa è consigliata la conoscenza
degli argomenti trattati nei corsi di base di Analisi Statistica Multivariata
Metodi didattici
Lezioni teoriche in aula ed esercitazioni pratiche in laboratorio statistico-informatico con il software SAS
Modalità di verifica dell'apprendimento
L'esame consiste nella preparazione di un'analisi statistica di dati con il software SAS (secondo le modalità specificate sulla piattaforma e-learning del corso), che dovrà essere poi discussa in sede d'esame, e in una prova scritta (durata: 2 ore) che ha ad oggetto argomenti sia a natura teorica sia a natura pratica. Le domande a natura teorica sono di carattere generale. Le parti con natura più metodologica sono oggetto di una domanda facoltativa.
Relativamente alla parte puramente applicativa si richiede di preparare con il software SAS un'analisi di dati sulla base di una delle metodologie trattate durante il corso. Il commento dell'analisi così prodotta è oggetto di discussione in sede d'esame.
La metodologia in base alla quale preparare l'analisi viene assegnata nominalmente e in modo casuale (mediante l'ausilio di un generatore di numeri casuali) a ciascuno studente iscritto alla piattaforma e-learning del corso.
L'analisi statistica deve essere preparata prima della prova d'esame seguendo una traccia specifica relativa alla metodologia assegnata e pubblicata alla fine del corso sulla piattaforma e-learning. In sede d'esame si dovrà poi presentare la stampa dell'output secondo le modalità specificate sulla piattaforma e-learning del corso.
Considerata l'abbondanza di materiale didattico messo a disposizione dalla docente sulla piattaforma e-learning del corso, non si prevede alcuna distinzione fra esami per studenti frequentanti ed esami per studenti non frequentanti.
Testi di riferimento
- Materiale didattico della docente pubblicato sul sito e-learning del corso
- Agresti, A. (2002), Categorical Data Analysis, Second Edition, New York: John Wiley & Sons
- Dobson, A. (1990), An Introduction to Generalized Linear Models, London: Chapman & Hall
- Littell, R. C., Freund, R. J., and Spector, P. C. (2002), SAS for Linear Models, 4th Edition, Cary, NC: SAS Institute Inc.
- Searle, S. R. (1971), Linear Models, New York: John Wiley & Sons
Periodo di erogazione dell’insegnamento
I Semestre, II ciclo
Lingua di insegnamento
Italiano
Learning objectives
The course introduces the linear models for categorical data according to two different settings. The first concerns the general linear model (GLM), including several special cases such as ANOVA and ANCOVA models. The second setting deals with the generalized linear models, in particular Poisson log-linear models for count data and binomial logistic models, in a GLM perspective. Analyses of empirical cases are carried out through the SAS software.
Contents
General Linear Model (GLM), one-way or more than one-way ANOVA and ANCOVA models. Generalized Linear Models (GzLM), binomial logistic model and Poisson log-linear model. Applications to real and experimental data with the SAS software.
Detailed program
- Theory of general linear model (GLM): model specification, assumptions, generalized inverse, estimable functions, testable hypotheses. Link with the constrained least-squares estimation method. Sum-to-zero and set-to-zero linear constraint approaches. Effect parameterization vs. reference category parameterization. Contrasts
- Special cases of GLM: one-way or more than one-way fixed-effects ANOVA models, ANCOVA model. SAS PROC GLM
- GLM selection: forward and stepwise methods. SAS PROC GLMSELECT
- Generalized Linear Model (GzLM): probability distribution function of response variables, link function, model specification, maximum likelihood estimation method, estimator properties, criteria for goodness-of-fit, confidence limits and statistical testing hypotheses
- Special cases of GzLM: Poisson log-linear model for count data and binomial logistic model, in a GLM perspective. SAS PROC GENMOD
Prerequisites
Knowledge
of the topics covered in undergraduate courses of Multivariate Statistical
Analysis is recommended
Teaching methods
Theoretical lectures in the classroom and practical exercises in the statistical-informatics laboratory with SAS software
Assessment methods
The exam consists in the preparation of a statistical data analysis with the SAS software (according to the modalities specified on the e-learning platform of the course), whose output has to be discussed during the examination, and in a written test (duration: 2 hours) concerning both theoretical and practical topics. The theoretical questions are general. The parts with a more methodological nature are the object of an optional issue.
Concerning the purely applicative part, it is required to prepare a data analysis with the SAS software using one of the methodologies covered during the course. The comment of the analysis thus produced is the object of discussion during the examination.
The methodology for preparing the analysis is assigned nominally and randomly (using a random number generator) to each student enrolled in the e-learning platform of the course.
The statistical analysis has to be prepared before the exam, following a specific track relative to the methodology assigned and published at the end of the course on the e-learning platform. During the examination, the printing of the output has then to be presented according to the modalities specified on the e-learning platform of the course.
Textbooks and Reading Materials
- Teaching material uploaded on the e-learning website of the course
- Agresti, A. (2002), Categorical Data Analysis, Second Edition, New York: John Wiley & Sons
- Dobson, A. (1990), An Introduction to Generalized Linear Models, London: Chapman & Hall
- Littell, R. C., Freund, R. J., and Spector, P. C. (2002), SAS for Linear Models, 4th Edition, Cary, NC: SAS Institute Inc.
- Searle, S. R. (1971), Linear Models, New York: John Wiley & Sons
Semester
First semester, second period
Teaching language
Italian
Key information
- Field of research
- SECS-S/01
- ECTS
- 6
- Term
- Annual
- Activity type
- Mandatory
- Course Length (Hours)
- 42
- Degree Course Type
- 2-year Master Degreee