Syllabus del corso
Obiettivi formativi
Il corso introduce una ampia classe di modelli statistici, nota come i modelli lineari generalizzati, evidenziare le caratteristiche teoriche e evidenziare le loro applicazioni nella ricerca epidemiologica e medica, utilizzando Stata (StataCorp).
2. Capacità di applicare conoscenza e comprensione (applying knowledge and understanding):
Sulla base delle conoscenze teoriche acquisite, lo studente sarà in grado di applicare i modelli lineari generalizzati per analizzare dati provienienti sia da studi epidemiologici che da ricerche mediche: in particolare lo studente sara' in grado di procedere con la rappresentazione grafica e tabellare dei dati, con la formulazione e implementazione dei modelli lineari generalizzati, con l'interpretazione delle stime ottenute e formulazione di appropriati test statistici, con la valutazione della bontà di adattamento del modello statistico, e per la diagnostica de modello statistico. Il software statistico di riferimento che verrà proposto e insegnato è Stata. v3. Autonomia di giudizio (making judgements):
Utilizzando i modelli statistici appartenenti alla famiglia dei modelli lineari generalizzati, oggetto del programma dell'insegnamento, lo studente sarà in grado di individuare il modello corretto per l'analisi ed l'interpretazione di dati di natura epidemiologica, evidenziando le caratteristiche del modello implementato, con enfasi sull'interpretazione dei parametri stimati, sull'implicazione statistiche e epidemiologiche dei risultati ottenuti.
4. Abilità comunicative (communication skills):
Lo studente sarà in grado di comunicare i risultati ottenuti, con valutazioni analitiche e al tempo stesso di sintesi sui modelli applicati.
5. Capacità di apprendimento (learning skills)
Alla fine dell'insegnamento lo studente avrà acquisito le conoscenze per utilizzare il software statistico Stata, sia per effettuare il data management sia per costruire i principali i modelli lineari generalizzati, procedere alla costruzione della stima puntuale, intervallo di confidenza, test d’ipotesi del coefficiente di regressione, per ogni modello lineare generalizzato oggetto del corso interpretare i parametri dei vari modelli, studiare l’adattamento del modello ed effettuarne la diagnostica, ottenere una visione critica dei modelli lineari generalizzati a livello teorico e capire l’approccio metodologico direttamente sul software Stata. L'insegnamento consente allo studente di acquisire solide basi nella costruzione, nell’interpretazione e nella diagnostica dei modelli lineari generalizzati. Tali capacità saranno sviluppate sia a livello teorico/interpretativo sia pratico, direttamente sul software. Al termine del corso lo studente sarà in grado di approcciarsi in modo critico verso le evidenze scientifiche in ambito epidemiologico e pertanto di muoversi negli ambiti lavorativi di tale settore.
Contenuti sintetici
1. Review dei principi di base di probabilità e inferenza
2. Il modello di regressione lineare
3. Il modello lineare generalizzato e la famiglia esponenziale.
4. Il modello di regressione logistica
5. Il modello di regressione logistica ordinale
6. Il modello di regressione di Poisson
7. Riassunto del corsoProgramma esteso
- Variabili aleatorie
- Distribuzioni Statistiche
- Metodi di stima
- Intervalli di confidenza e test di ipotesi
2. Introduzione a Stata
- Formulazione del modello
- Analisi della varianza e della covarianza
- Studio dell’adattamento del modello
- Diagnostica
4. Il Modello lineare generalizzato- Famiglia esponenziale
- Stima di massima verosimiglianza
- Definizione di devianza
- Il test del rapporto della massima verosimiglianza
5. Il modello di regressione logistica
- Dati bernoulliani e binomiali
- Formulazione del modello: funzione logit
- Stima, intervallo di confidenza, test d’ipotesi del coefficiente di regressione
- Interpretazione dei parametri
- Godness of Fit
- Applicazione
6. Il modello di regressione Logistica Ordinale
- Formulazione del modello delle odds proporzionali
- Stima, intervallo di confidenza, test d’ipotesi del coefficiente di regressione
- Intepretazione dei parametri
- Studio dell’adattamento del modello
- Diagnostica
- Applicazione
7. Il modello di regressione di Poisson
- Definizione di tasso d’incidenza
- Anni persona
- Definizione della funzione di link logaritmica
- Stima, intervallo di confidenza, test d’ipotesi del coefficiente di regressione
- Interpretazione dei parametri
- Studio dell’adattamento del modello
- Diagnostica
Prerequisiti
Metodi didattici
Il materiale didattico verra' presentato in classe con lezioni frontali e applicazioni utilizzando dati reali provenienti da studi epidemiologici osservazionali, dove verranno implementati i modelli formulati a lezione con l'obiettivo duplice di mostrare l'utilizzo di uno dei software piu' comunumente usati in biostatistica e epidemiologia (Stata) e evidenziare come interpretare i modelli che vengono introdotti durante la lezione.
Modalità di verifica dell'apprendimento
L’esame è in forma scritta con orale facoltativo, che si concentra sulla discussione dello scritto. La verifica scritta si compone di alcune domande di teoria e dell’interpretazione di alcuni output di Stata. Le domande teoriche consentono di verificare sia gli aspetti teorici sottostanti i modelli lineari generalizzati, sia alcuni aspetti teorici relativi al software usato in classe (Stata). L’interpretazione degli output consente di verificare la conoscenza pratica e interpretativa dei modelli lineari generalizzati e di verificare la capacità di esprimersi con un adeguato linguaggio tecnico in termini di:
1) formulazione del modello statistico
2) applicazione del modello 3) intepretazione dei parametri 4) inferenza statistica in termini di intervalli di confidenza e verifica delle ipotesi 5) diagnostica e bonta' di adattamento 6) capacita' di discriminazione tra modelli competitivi.
Inoltre, la prova orale servira' per discutere domande e risposte dell'esame scritto, qualora queste non siano state espresse con chiarezza.
L’orale può comportare sia l’aumento che la diminuzione della valutazione della prova scritta.
Non si prevedono prove diverse tra studenti reqentanti e non.
Testi di riferimento
Principale:
Dobson, A.J. An introduction to generalized linear models, 3rd Edition. Chapman & Hall/CRC.B
Secondario:
Casella, G. and Berger, R.L. Statistical Inference, 2nd Edition. Brooks/cole. Cengage Learning
Materiale didattico:
Slides del corso, , articoli scientifici e altro materiale sono presenti sul sito ufficiale del corso
Periodo di erogazione dell’insegnamento
II Semestre, IV ciclo
Lingua di insegnamento
Italiano con materiale di insegnamento in Inglese
Learning objectives
1. Knowledge and Understanding:
The main course aim is to introduce a wide class of statistical models, known as Generalized Linear Models (GLM), pintpointing theoretical
principles and highlighting their practical aspects and applications in epidemiology and medicine, using Stata, a statistical software widely used in epidemiology and applied medical research.
2. Applying knowledge and understanding
The student will be able to formulate and implement the correct statistical analysis of dependent and independent variables to be used within the Generalized Linear Models framework, in particular she/he will be able to produce ·data and variables graphical represention and tabular description of the variables, draw a formulation of the correct generalized linear models, proceed with the interpretation of results, goodness of fit, running the statistical software Stata.
3. Making JudgementsThe student will acquire the tools to construct, interpret, and assess the Generalized Linear Models. Such abilities will be boosted both from a theorectical point of view and from a practical standpoint, by using the statistical software Stata. At the end of the course, the students should be able to use the correct approach when facing with the need to determine evidence from epidemiological and medical studies, with the ultimate goal of being independent when analyzing data.
4. Communication skills
The student will learn how to communicate the results and findings from the statistical analyses, assessing the statistical and epidemiological implications of the results from the models being applied.
5. Learning skills
At the end of the course students will be able to: use Stata both for data management and model building, compute point estimates, confidence intervals and hypothesis tests, provide a valid and clear interpretation of the model parameters , assess the overall model fitting and use proper model diagnostics. Furthermore the student will be able to deeply and critically understand the models being fitted and integrate the use of Stata to digest the underlying theory.
Contents
1. Review of basic principles of probability and inference
2. The Linear regression model
3. The Generalized Linear Regression model: the exponential family
4. The Logistic regression model
5. The Ordinal logistic regression model
6. The Poisson regression model
7. Course reviewDetailed program
- Random variables
- Statistical Distributions
- Methods for model estimation
- Confidence intervals and hypothesis testing
2. Introduction to Stata
3. Linear regression model
- Model definition
- Analysis of variance and analysis of covariance
- Goodness of fit
- Diagnostics
4. Generalized linear model
- Exponential family
- Maximum likelihood estimation
- Definition of deviance
- Likelihood likelihood ratio test
5. Logistic regression model
- Bernoullian and binomial data
- Model definition: logit function
6. Ordinal logistic regression model
- Model definition: proportional odds
7. Poisson regression model and log-linear model
- Definition of incidence rate- Person-years
- Definition of logarithmical link function
For all models:
- Regression coefficient: estimation, confidence interval and hypotheses testing
- Parameters interpretation
- Assessment of model fitting
- Diagnostics
Prerequisites
Both courses on Statistics II and Medical Statistics must be successfully passed before
Teaching methods
The material will be presented in class with formal lectures plus applied work using Stata, one of the most used statistical software in biostatistics and epidemiogy, with the twofold gold of teaching the software as well as how to interpret the models introduced in class.
Assessment methods
The exam will be consist of a written test in addition to an optional oral discussion.
In the written part, we will assess both theoretical and some more applied aspects of the course, meaning how to correctly formulate the statistical models and intepret the findings, based on the software being used (Stata). In particular to assess the learning outcomes of the course the exam will ne based on 1) model formulation 2) model application 3) interpretation of the parameters 4) statistical inference 5) diagnostic and model fitting ) choice of best model 6) Reporting of findings
In the oral discussion (n.b, it is not compulsory) we will assess the capacity of the student in the interpretation and communication of the findings and if the right language is being used. the oral discussion will also serve as a tool to discuss unclear answers from the written part.
An oral discussion will serve to clear the exam questions; the final score can be either increased or decreased afterwords.
No different exams will be provided between attending and no attending students.
Textbooks and Reading Materials
Main:
Dobson, A.J. An introduction to generalized linear models, 4rd Edition. Chapman & Hall/CRC.B
Secondary:
Casella, G. and Berger, R.L. Statistical Inference, 2nd Edition. Brooks/cole. Cengage Learning
Class Material:Instructor's notes, papers and other material will be uploaded on the course homepage
Semester
II Semester, IV term
Teaching language
Italian with English material
Scheda del corso
Staff
-
Rino Bellocco
-
Federica Gallo