- Area Economico-Statistica
- Corso di Laurea Magistrale
- Biostatistica [F8203B]
- Insegnamenti
- A.A. 2024-2025
- 2° anno
- Statistical Models in Epidemiology (blended)
- Introduzione
Syllabus del corso
Obiettivi formativi
1. Conoscenza e capacità di comprensione (knowledge and understanding):
Il corso si propone di introdurre i metodi e le tecniche statistiche per lo studio e analisi (1) dei tempi di sopravvivenza: stima della distribuzione dei tempi di sopravvivenza, confronto tra curve di sopravvivenza, modelli semi-parametrici, modelli parametrici, rischi competitivi, modelli multivariati di sopravvivenza, regressione quantilica, disegno dello studio; (2) dei dati longitudinali di tipo continuo e discreto: modelli marginali, modelli a effetti misti, modelli GEE, dati mancanti.
2. Capacità di applicare conoscenza e comprensione (applying knowledge and understanding):
Sulla base delle conoscenze acquisite, lo studente sarà in grado di applicare le conoscenze acquisite per analizzare con strumenti appropriati i tempi di sopravvivenza e i dati longitudinali, utilizzando il software statistico Stata (StataCorp), di ampio uso in epidemiologia e biostatistica. Applicazioni in R saranno presentate brevemente in appositi seminari.
3. Autonomia di giudizio (making judgements):
Utilizzando le metodologie presentate a lezione, lo studente dovra' utilizzare le tecniche statistiche presentate per analizzare come variabili di esposizione, fattori di rischio, trattamenti, provenienti da studi epidemiologici o clinici possono avere un impatto sui tempi di sopravvivenza e sulle misure ripetute di dati longitudinali, e in modo critico valutare la performance del modello statistico utilizzato.
4. Abilità comunicative (communication skills)
Lo studente dovra' essere in grado di comprendere il materiale presentato in classe e di comunicare in modo autonomo le tecniche statistiche imparate in classe e esporre in modo chiaro come interpretare i risultati ottenuti.
5. Capacità di apprendimento (learning skills):
Lo studente acquisira' le capacita' e conoscenze necessarie per analizzare i dati di sopravvivenza e longitudinali provenienti da uno studio epidemiologico o da un studio clinico, attraverso un percorso composto da lezioni teoriche e da applicazioni in Stata.
Contenuti sintetici
- Analisi dei Dati di Sopravvivenza: Introduzione all'analisi della sopravvivenza. Censura e troncamento. Funzioni di sopravvivenza, densità e rischio. Procedura “st” in Stata. Stima e confronto delle funzioni di sopravvivenza. Il modello di regressione di Cox. Analisi dei rischi competitivi. Modelli di sopravvivenza parametrici. Regressione quantilica. Disegno dello studio.
- Analisi dei dati longitudinali: Introduzione all’analisi dei dati longitudinali: i modelli marginali e i modelli a effetti casuali per risposte continue e discrete.
Programma esteso
1. Analisi dei Dati di Sopravvivenza: Introduzione all'analisi della sopravvivenza. Definizione ed esempi. Censura e troncamento. Funzioni di sopravvivenza, densità e rischio. Procedura “st” in Stata. Stima e confronto delle funzioni di sopravvivenza di Kaplan-Meier e Nelson-Aalen. Tavole di sopravvivenza. Log-rank test, Wilcoxon-Breslow-Gehan, Tarone-Ware test. Il modello di regressione di Cox. Formulazione e ipotesi. Verosimiglianza Parziale. Interpretazione dei parametri del modello. Diagnostica: Martingale e Deviance dei residuals, valutazione delle ipotesi del modello. Analisi dei rischi competitivi: definizione di net e crude survival, la funzione di incidenza cumulativa, hazard causa specifica e la funzione subhazard. Il modello di Fine e Gray. Modelli parametrici: esponenziale e weibull. La regressione quantilica. La sopravvivenza multivariata. Introduzione al disegno dello studio. Applicazioni in R e SAS.
2. Analisi dei dati longitudinali: Introduzione all’analisi dei dati longitudinali: esempi e motivazioni. Modelli di risposta per lo studio dei dati longitudinali: estensione dei modelli standard. Struttura della matrici di varianza e covarianza. Analisi dei profili di risposta. I modelli a effetti casuali per risposte continue e discrete. Modelli a effetti fissi. Introduzione ai valori mancanti: definizione, trattamento e possibili metodi di stima. Introduzione ai dati mancanti.
Prerequisiti
Le lezioni vengono svolte in lingua inglese, anche il materiale distribuito e' in lingua inglese: dunque la conoscenza della lingua inglese e' considerata un requisito importante per la partecipazione attiva in classe, per la comprensione delle slides utilizzate, e per la lettura di tutto il materiale del corso.
Metodi didattici
Blended/Elearning: Lezioni frontali e online , group work, seminars, utilizzo di Stata. Le lezione online saranno svolte con un duplice scopo: il primo e' quello di consentire a studenti non frequentanti di seguire alcune lezioni, che verranno preparate e registrate e dunque rese disponibili nella piattaforma elearning. Il secondo e' quello di discutere e rivedere alcuni degli esercizi che gli studenti hanno svolto , evidenziando le problematiche presenti, proponendo un modello di soluzione alle domande
Le lezioni in presenza verranno eventualmente trasmesse live e le lezioni registrate verranno rese disponibili sulla piattaforma di ateneo.
Modalità di verifica dell'apprendimento
- Esame Finale (90% votazione finale).
- Discussione paper, assegnando un articolo di interesse a gruppi di max 5 studenti (10% votazione finale).
- Prova orale-facoltativa: La discussione orale dell'esame scritto serve per valutare la conoscenza dello studente laddove le risposte all'esame non siano state chiare e poste in modo impreciso.
Sia la discussione del paper che l'esame finale, che si basa su domande chiuse e aperte, hanno come fine quello di valutare il grado di apprendimento dello studente per valutare se gli obiettivi del corso sono stati raggiunti in termine di formulazione delle ipotesi dello studio, analisi descrittive, inferenza statistica, interpretazione dei parametri, valutazione delle ipotesi dei modelli fittati, utilizzando Stata.
La discussiome orale può prevedere la rivalutazione del punteggio ottenuto nella prova scritta.
Per gli studenti che non possono partecipare alla preparazione del lavoro di gruppo, la valutazione si baserà sulla prova scritta e orale soltanto, con un peso del 100%.
L'esame scritto finale e' lo stesso per studenti frequentanti e studenti non frequentanti/
Testi di riferimento
- Kleinbaum, D.G. and Klein, M. Survival Analysis, A self-learning text. (2013). Springer.
- Fitzmaurice, G. M., Laird, N. M., and Ware, J. H. (2013). Applied Longitudinal Analysis, Chapman & Hall CRC.
- Jewell, N.P. Statistics for Epidemiology. (2004). Chapman & Hall CRC.
Materiale integrativo sara’ fornito durante le lezioni e messo a disposizione tramite la pagina web del corso.
Periodo di erogazione dell'insegnamento
Secondo Semestre: Terzo ciclo
Lingua di insegnamento
Inglese
Sustainable Development Goals
Learning objectives
1. Knowledge and Understanding:
The course aims to introduce statistical methods to analyse (1) survival data: univariate estimation of survival times, group comparions, semi-parametric and parametric models, , competing risks, quantile regressionstudy designs; and and longitudinal data of repeated continuous and discrete measurements, conditional and marginal models (fixed and random effects), GEE models, missing data.
2. Applying knowledge and understanding:
Based on the methods taught in class, the students will apply the statistical models for survival and longitudinal data using Stata (StataCorp), widely used in the field of epidemiology and biostatistics. Also aplications in will be briefly introduced.
3. Making judgements:
Having learnt methods and applications, the student will also show which methods and techniques are to be used given the study and the data at hand, by critically assessing the statistical and clinical implications of the models being used.
4. Communication skills:
The student will be able to explain how the methods can be applied and interpret the results in a clear and simple way.
5. Learning skills:
The students will learn how to analyse survival and longitudinal data from epidemiological and clinical studies, by understanding the methodology and by using Stata.
Contents
- Survival Data Analysis: Introduction to Survival Data Analysis: Definitions. Censoring, Truncation, Survival Function, Hazard Function. Estimate and Comparison of Survival Curves. Cox Regression. Parametric Regression. Competing Risk. Quantile regression. Study design.
- Introduction to longitudinal data: Summary Measure of Analysis of Longitudinal data. Modeling the mean response (analysis of response profiles, parametric and semi-parametric trends). Modeling the covariance. Linear mixed effects models. Generalized linear model for discrete longitudinal data. GEE models. Missing data in longitudinal studes.
Detailed program
1. Survival Data Analysis: Introduction to Survival Data Analysis: Definitions and examples. Censoring and Truncation. Survival Function, Density Function and Hazard Function. Estimate and Comparison of Survival Curves (Log-rank test, Wilcoxon-Breslow-Gehan, Tarone-Ware test). Cox proportional Hazard Regression. Parametric Regression: the explonential and Weibull models. Competing Risk: net and crude survival, the cumulative incidence funzion, cause specific hazard and subhazard function. The Fine and Gray model. Quantile regression. Study design. Introduction to multiple events. Applications in R and SAS.
2. Introduction to longitudinal data: Summary Measure of Analysis of Longitudinal data. Modeling the mean response (analysis of response profiles, parametric and semi-parametric trends). Modeling the covariance structure (independence, exchangeable, unstructured, etc). Linear mixed effects models. Generalized linear model for discrete longitudinal data. Missing data in longitudinal studes.
Prerequisites
The course is offered in english, fluency in the english language is an important condition for successfully attending the lectures (listening comprehension and reading ability) and reading the additional material.
Teaching methods
Blended/elearning: frontal lectures, online lectures, group work, seminars, use of Stata. Online teaching will be used to allow students (unable to attend class) to follow some of the lectures of the course. Recorded lectures will be prepared and uploaded during the course. Moreover, homeworks will be discussed and solutions will be proposed.
Teaching sessions will be eventually broadcasted and the recording of lectures will be uploaded.
Assessment methods
- Final Written exam (90% of the total score)
- Paper discussion, assigned to group of max 5 students (10% of the total score)
- Oral discussion (discretionary): it will serve to review the exam to better assess the student knowledge and unclear answers
Both the paper discussione based on teamwork and the final exam will help to evaluate the student knowledge necessary to discuss the goal of the study being proposed to be analyzed using Stata, to run initial descriptive analyses, how to proceed with statistical inference and parameter interpretation, and overall model fitting.
The final score can change after the oral review.
Students not willing or able to participate in the paper discussion will be required to take the final exam which willl be given full weight.
Written exams are no different between attending and not attending students.
Textbooks and Reading Materials
- Kleinbaum, D.G. and Klein, M. Survival Analysis, A self-learning text. (2013). Springer.
- Fitzmaurice, G. M., Laird, N. M., and Ware, J. H. (2013). Applied Longitudinal Analysis, Chapman & Hall CRC.
- Jewell, N.P. Statistics for Epidemiology. (2004). Chapman & Hall CRC.
Additional material is provided and made available in the course homepage
Semester
Second Semester: Third term
Teaching language
English