- Area Economico-Statistica
- Corso di Laurea Magistrale
- Biostatistica [F8203B]
- Insegnamenti
- A.A. 2021-2022
- 2° anno
- Statistical Models in Epidemiology (blended)
- Introduzione
Syllabus del corso
Obiettivi formativi
1. Conoscenza e capacità di comprensione (knowledge and understanding):
Il corso si propone di introdurre metodi e tecniche statistiche per lo studio (1) dei tempi di sopravvivenza: stima della distribuzione dei tempi di sopravvivenza, confronto tra curve di sopravvivenza, modelli semi-parametrici, modelli parametrici, rischi competitivi, modelli multivariati di sopravvivenza, regressione quantilica, disegno dello studio; (2) dei dati longitudinali di tipo continuo e discreto: modelli marginali, modelli a effetti misti, modelli GEE, dati mancanti.
2. Capacità di applicare conoscenza e comprensione (applying knowledge and understanding):
Sulla base delle conoscenze acquisite, lo studente sarà in grado di applicare le conoscenze acquisite per analizzare con strumenti appropriati i tempi di sopravvivenza e i dati longitudinali, utilizzando il software statistico Stata (StataCorp), di ampio uso in epidemiologia e biostatistica. Applicazioni in R and SAS saranno presentate brevemente in appositi seminari.
3. Autonomia di giudizio (making judgements):
Utilizzando le metodologie presentate a lezione, lo studente dovra' utilizzare le tecniche statistiche presentate per analizzare come variabili di esposizione, fattori di rischio, trattamenti, provenienti da studi epidemiologici o clinici possono avere un impatto sui tempi di sopravvivenza e sulle misure ripetute di dati longitudinali, e in modo critico valutare la performance del modello statistico utilizzato.
4. Abilità comunicative (communication skills)
Lo studente dovra' essere in grado di comprendere il materiale presentato in classe e di comunicare in modo autonomo le tecniche statistiche imparate in classe e esporre in modo chiaro come interpretare i risultati ottenuti.
5. Capacità di apprendimento (learning skills):
Lo studente acquisira' le capacita' e conoscenze necessarie per analizzare i dati di sopravvivenza e longitudinali provenienti da uno studio epidemiologico o da un studio clinico, attraverso un percorso composto da lezioni teoriche e da applicazioni in Stata.
Contenuti sintetici
- Analisi dei Dati di Sopravvivenza: Introduzione all'analisi della sopravvivenza. Censura e troncamento. Funzioni di sopravvivenza, densità e rischio. Procedura “st” in Stata. Stima e confronto delle funzioni di sopravvivenza. Il modello di regressione di Cox. Analisi dei rischi competitivi. Modelli di sopravvivenza parametrici. Regressione quantilica. Disegno dello studio.
- Analisi dei dati longitudinali: Introduzione all’analisi dei dati longitudinali: i modelli marginali e i modelli a effetti casuali per risposte continue e discrete.
Programma esteso
1. Analisi dei Dati di Sopravvivenza: Introduzione all'analisi della sopravvivenza. Definizione ed esempi. Censura e troncamento. Funzioni di sopravvivenza, densità e rischio. Procedura “st” in Stata. Stima e confronto delle funzioni di sopravvivenza di Kaplan-Meier e Nelson-Aalen. Tavole di sopravvivenza. Log-rank test, Wilcoxon-Breslow-Gehan, Tarone-Ware test. Il modello di regressione di Cox. Formulazione e ipotesi. Verosimiglianza Parziale. Interpretazione dei parametri del modello. Diagnostica: Martingale e Deviance dei residuals, valutazione delle ipotesi del modello. Analisi dei rischi competitivi: definizione di net e crude survival, la funzione di incidenza cumulativa, hazard causa specifica e la funzione subhazard. Il modello di Fine e Gray. Modelli parametrici: esponenziale e weibull. La regressione quantilica. La sopravvivenza multivariata. Introduzione al disegno dello studio. Applicazioni in R e SAS.
2. Analisi dei dati longitudinali: Introduzione all’analisi dei dati longitudinali: esempi e motivazioni. Modelli di risposta per lo studio dei dati longitudinali: estensione dei modelli standard. Struttura della matrici di varianza e covarianza. Analisi dei profili di risposta. I modelli a effetti casuali per risposte continue e discrete. Modelli a effetti fissi. Introduzione ai valori mancanti: definizione, trattamento e possibili metodi di stima. Introduzione ai dati mancanti.
Prerequisiti
Le lezioni vengono svolte in lingua inglese, anche il materiale distribuito e' in lingua inglese: dunque la conoscenza
della lingua inglese e' considerata un requisito importante per la partecipazione attiva in classe, per la comprensione delle slides utilizzate, e per la lettura di tutto il materiale del corso.
Metodi didattici
Blended/Elearning: Lezioni frontali e online , group work, seminars, utilizzo di Stata. Le lezione online saranno svolte con un duplice scopo: il primo e' quello di consentire a studenti non frequentanti di seguire alcune lezioni, che verranno preparate e registrate e dunque rese disponibili nella piattaforma elearning. Il secondo e' quello di discutere e rivedere i compiti che gli studenti hanno preparato, evidenziando le problematiche presenti, proponendo un modello di soluzione al compito.
A causa delle emergenza Covid-19 le lezioni in presenza verranno trasmesse live e le lezioni registrateverranno rese disponibili sulla piattaforma di ateneo.
Modalità di verifica dell'apprendimento
- Lavoro di gruppo (30% votazione finale) (max 5 - 6 studenti) che si basa sulla consegna di 9 compiti, uno a settimana, conta per il 30% della votazione finale.
- Esame Finale (70% votazione finale).
- Prova orale-facoltativa : La discussione orale dell'esame scritto serve per valutare la conoscenza dello studente laddove le risposte all'esame non siano state chiare e poste in modo impreciso.
Sia i compiti che si basano sul lavoro di gruppo, sia l'esame finale, hanno come fine quello di valutare il grado di apprendimento dello studente e se gli obiettivi del corso sono stati raggiunti in termine di formulazione delle ipotesi dello studio analizzato utilizzando Stata, analisi descrittive, inferenza statistica, interpretazione dei parametri, valutazione delle ipotesi dei modelli fittati.
L’orale può comportare sia l’aumento che la diminuzione della valutazione della prova scritta.
Per gli studenti che non possono partecipare al lavoro di gruppo, la valutazione si baserà sulla prova scritta e orale soltanto, con un peso del 100%.
L'esame scritto finale e' lo stesso per studenti frequentanti e studenti non frequentanti
Nel periodo di emergenza Covid-19 gli esami saranno solo telematici. Verranno svolti utilizzando la piattaforma Zoom e WebEx e nella pagina e-learning dell'insegnamento verrà riportato un link pubblico per l'accesso all'esame di possibili spettatori virtuali.
Testi di riferimento
- Kleinbaum, D.G. and Klein, M. Survival Analysis, A self-learning
text. (2013). Springer.
- Fitzmaurice, G. M., Laird, N. M., and Ware, J. H. (2013).
Applied Longitudinal Analysis, Chapman & Hall CRC.
- Jewell, N.P. Statistics for Epidemiology. (2004). Chapman
& Hall CRC.
Materiale integrativo sara’ fornito durante le lezioni e messo a disposizione tramite la pagina web del corso.
Periodo di erogazione dell’insegnamento
II Semestre, III ciclo
Lingua di insegnamento
Inglese
Learning objectives
1. Knowledge and Understanding:
The course aims to introduce statistical methods to analyse (1) survival data: univariate estimation of survival times, group comparions, semi-parametric and parametric models, , competing risks, quantile regressionstudy designs; and and longitudinal data of repeated continuous and discrete measurements, conditional and marginal models (fixed and random effects), GEE models, missing data.
2. Applying knowledge and understanding:
Based on the methods taught in class, the students will apply the statistical models for survival and longitudinal data using Stata (StataCorp), widely used in the field of epidemiology and biostatistics. Also R and SAS will be briefly introduced.
3. Making judgements:
Having learnt methods and applications, the student will also show which methods and techniques are to be used given the study and the data at hand, by critically assessing the statistical and clinical implications of the models being used.
4. Communication skills:
The student will be able to explain how the methods can be applied and interpret the results in a clear and simple way.
5. Learning skills:
The students will learn how to analyse survival and longitudinal data from epidemiological and clinical studies, by understanding the methodology and by using Stata.
Contents
|
Kleinbaum, D.G. and Klein, M. Survival Analysis, A self-learning text. (2013). Springer. Fitzmaurice, G. M., Laird, N. M., and Ware, J. H. (2013). Applied Longitudinal Analysis, Chapman & Hall CRC. Jewell, N.P Statistics for Epidemiology. (2004). Chapman & Hall CRC.
Additional material is provided and made available on the course homepage |
Detailed program
1.
Survival Data Analysis: Introduction
to Survival Data Analysis: Definitions and examples. Censoring and Truncation.
Survival Function, Density Function and Hazard Function. Estimate and
Comparison of Survival Curves (Log-rank test, Wilcoxon-Breslow-Gehan,
Tarone-Ware test). Cox proportional Hazard Regression. Parametric
Regression: the explonential and Weibull models. Competing Risk: net and
crude survival, the cumulative incidence funzion, cause specific hazard
and subhazard function. The Fine and Gray model. Quantile regression.
Study design. Introduction to multiple events. Applications in R and SAS.
2. Introduction to longitudinal data: Summary Measure of Analysis of Longitudinal data. Modeling the mean response (analysis of response profiles, parametric and semi-parametric trends). Modeling the covariance structure (independence, exchangeable, unstructured, etc). Linear mixed effects models. Generalized linear model for discrete longitudinal data. Missing data in longitudinal studes.
Prerequisites
The course is
offered in english, fluency in the english language is an important condition for successfully attending the lectures (listening comprehension and reading ability) and reading the additional material.
Teaching methods
Blended/elearning: frontal lectures, online lectures, group work, seminars, use of Stata. Online teaching will be used to allow students (not coming to class) to follow some of the lectures of the course. Lectures will be prepared and uploaded during the course. Moreover, homeworks will be discussed and possible solutions proposed once the homeworks are corrected.
Due to the current Covid-19 pandemic, teaching sessions will be broadcasted and recorded lectures will be made avalaible.
Assessment methods
- Homeworks (30%), once a week
- Final Written exam (70%)
- Oral discussion (discretionary): it will serve to review the exam to better assess the student knowledge and unclear answers.
Both homeworks based on team work and the final exam will help to evaluate the student knowledge necessary to discuss the goal of the study being proposed to be analyzed using Stata, to run initial descriptive analyses, how to proceed with statistical inference and parameter interpretation, and overall model fitting.
The final score can be either increased or decreased after the oral review.
Students not willing or able to participate in the group work will be required to take the final exam which willl be given full weight.
Written exams are no different between attending and not attending students.
Due to the Covid-19 pandemic, exams will be run using online platforms (such as Zoom and WebEx), allowing for a public link.
Textbooks and Reading Materials
- Kleinbaum, D.G. and Klein, M. Survival Analysis, A self-learning text. (2013). Springer.
- Fitzmaurice, G. M., Laird, N. M., and Ware, J. H. (2013). Applied Longitudinal Analysis, Chapman & Hall CRC.
- Jewell, N.P. Statistics for Epidemiology. (2004). Chapman & Hall CRC.
Additional material is provided and made available in the course homepage
Semester
II Semester, III
Teaching language
English
Scheda del corso
Staff
-
Rino Bellocco
-
Marta Ponzano