- Big Data in Health Care
- Summary
Course Syllabus
Obiettivi
Il corso si propone di fornire i concetti di base di epidemiologia clinica che sono alla base di un adeguato approccio metodologico a un progetto di ricerca nel campo clinico. Lo studente sarà in grado di gestire i big data nella ricerca medica, concentrandosi in particolare su diversi aspetti tra cui la progettazione, la gestione e l'analisi dei dati. Lo studente sarà in grado di implementare strategie di disegno adeguate ai trial clinici e studi osservazionali. Lo studente sarà in grado di applicare modelli di regressione per l’analisi di dati di sopravvivenza e di utilizzare questi modelli per la predizione del rischio e la valutazione di relazioni tra le variabili. Lo studente sarà in grado di usare metodologie statistiche adeguate per lo studio di dati omici.
Conoscenza e capacità di comprensione
Questo corso fornisce conoscenze e comprensione di base su:
- progettazione di studi clinici
- quantità fondamentali nell'analisi di sopravvivenza (sopravvivenza, incidenza cumulativa, funzioni di rischio)
- metodi statistici per l'analisi di dati "time-to-event", sia in contesti standard che ad alta dimensionalità
- misure di performance predittiva e utilità di un modello di predizione clinica
Conoscenza e capacità di comprensione applicate
Alla fine del corso, gli studenti saranno in grado di:
- stimare e confrontare funzioni di sopravvivenza utilizzando metodi non parametrici (stimatore di Kaplan-Meier e test Log-Rank)
- applicare un modello di regressione di Cox e interpretarne i coefficienti
- usare il modello per predire la funzione di sopravvivenza specifica per profilo
- valutare la performance predittiva e di utilità di un modello di predizione clinica
- applicare un modello penalizzato nel contesto di dati ad alta dimensionalità (omics)
Autonomia di giudizio
Alla fine del corso, gli studenti saranno in grado di:
- verificare la validità delle assunzioni richieste dal modello di regressione di Cox
- giudicare e confrontare la calibrazione, la discriminazione e l’utilità clinica dei modelli di predizione
Contenuti sintetici
Epidemiologia clinica. Disegni di trial clinici e studi osservazionali. Metodi statistici per l’analisi di dati di sopravvivenza, dati con misure ripetute, modelli di predizione del rischio e inferenza causale. Metodi statistici per l’analisi di dati "omici".
Programma esteso
Nozioni di base sull'epidemiologia clinica.
Disegni di studio: cross-sectional, caso-controllo, trial randomizzati, disegni per la validazione di biomarkers.
Metodi statistici per l'analisi della sopravvivenza (stimatore di Kaplan-Meier, test Log-Rank, modello di Cox), metodi per rischi competitivi e modelli multistato, modelli predittivi di rischio (stima e validazione).
Metodi di regressione penalizzata per l'analisi della sopravvivenza su dati di "omica".
Prerequisiti
Statistica descrittiva e inferenziale.
Modalità didattica
Insegnamento con ore frontali e attività di laboratorio:
- 3 lezioni da 3, 2 e 2 ore (7 ore complessive) svolte in modalità erogativa in presenza;
- 7 lezioni da 3 o 2 ore (18 ore complessive) di attività di laboratorio informatico (tramite l'utilizzo del software R) in modalità interattiva in presenza.
Materiale didattico
Slides proiettate a lezione.
Si segnalano i seguenti testi per approfondimento:
Machin D., Campbell M.J. (2005). Design of studies for medical research, Chichester: John Wiley & Sons.
E. Marubini, M.G. Valsecchi (1995). Analysing survival data from clinical trials and observational studies, Chichester: John Wiley & Sons.
Vittinghoff, E., Glidden, D. V., Shiboski, S. C., McCulloch, C. E. (2005). Statistics for biology and health. Regression methods in biostatistics: Linear, logistic, survival, and repeated measures models. New York, NY, US: Springer Publishing Co.
Laird N.M., Lange C. (2011). The fundamentals of modern statistical genetics. New York, NY, US: Springer Publishing Co.
Periodo di erogazione dell'insegnamento
Secondo semestre
Modalità di verifica del profitto e valutazione
L'esame sarà composto da due prove:
-
progetto individuale riguardante l’analisi di big data per testare la capacità dello studente nell'applicazione della metodologia di ricerca negli studi clinici. Verrà valutata la capacità dello studente di elaborare un'analisi completa tramite il software R e di saper correttamente interpretare i risultati. Il voto (in trentesimi) peserà per il 60% sul giudizio finale.
-
questionario con risposte chiuse a scelta multipla per testare la preparazione sugli aspetti teorici del programma complessivo. Verrà valutata la conoscenza dello studente di alcuni concetti chiave che riguardano sia il disegno che l'analisi degli studi clinici. Il voto (in trentesimi) peserà per il 40% sul giudizio finale.
Non sono previste prove in itinere.
Orario di ricevimento
Si riceve su appuntamento da concordare via e-mail.
Sustainable Development Goals
Aims
This course aims to provide the basic concepts of clinical epidemiology that are at the basis of a proper methodological approach to a research project in medicine. The student will be able to deal with big data in health care particularly focusing on several aspects including design, data management and analysis. The student will be able to implement optimal design strategies for clinical trials and observational studies. The student will be able to apply regression models for the analysis of time to event data and to use these models for risk prediction and for the assessment of relations between variables. The student will be able to use proper statistical methods for the analysis of omics data.
Knowledge and understanding
This course provides basic knowledge and understanding on:
- clinical study design
- fundamental quantities in survival analysis (survival, cumulative incidence, hazard funcitons)
- statistical methods to deal with time-to-event data boh in standard and high-dimensional contexts
- predictive and utility performance measures of a clinical prediction model
Ability to apply knowledge and understanding
At the end of this course the students will be able to:
- estimate and compare survival functions using non-parametric methods (Kaplan-Meier estimator and Log-Rank test)
- fit a Cox regression model and interpret the coefficients
- use the model to predict profile-specific survival function
- evaluate the prediction and utility performance of a clinical prediction model
- use a penalized model in the context of high dimensional data (omics)
Making judgements
At the end of this course the students will be able to:
- verify the validity of the assumptions required by the Cox regression model
- judge and compare the calibration and discrimination performance and the clinical utility of prediction models
Contents
Clinical epidemiology. Designs of clinical trials and observational studies. Statistical methods for time to event data, competing risks, predictive and utility performance measure for prediction models. Statistical methods for the analysis of omics data.
Detailed program
Basics in clinical epidemiology.
Study design in medicine: cross-sectional, case-control, case-cohort, randomized trials, biomarker driven designs.
Statistical methods for time-to-event data (Kaplan-Meier estimator, Log-Rank test, Cox regression model), competing risks and multistate models, risk prediction models (building and validation).
Penalized regression methods for the analysis of time-to-event data in omics.
Prerequisites
Descriptive and inferential statistics.
Teaching form
Teaching with face-to-face lectures and laboratory activities:
- 3 lectures of 3, 2 and 2 hours (7 hours total) conducted in face-to-face delivery mode;
- 7 lectures of 3 or 2 hours (18 hours total) of computer laboratory activities (through the use of R software) in interactive in-presence mode.
Textbook and teaching resource
Teaching slides.
The following textbooks are suggested:
Machin D., Campbell M.J. (2005). Design of studies for medical research, Chichester: John Wiley & Sons.
E. Marubini, M.G. Valsecchi (1995). Analysing survival data from clinical trials and observational studies, Chichester: John Wiley & Sons.
Vittinghoff, E., Glidden, D. V., Shiboski, S. C., McCulloch, C. E. (2005). Statistics for biology and health. Regression methods in biostatistics: Linear, logistic, survival, and repeated measures models. New York, NY, US: Springer Publishing Co.
Laird N.M., Lange C. (2011). The fundamentals of modern statistical genetics. New York, NY, US: Springer Publishing Co.
Semester
Second semester
Assessment method
The exam will consist of two tests:
-
individual project concerning the analysis of big data to test the student's ability to apply the research methodology in clinical studies. The student's ability to develop a complete analysis using the R software and to correctly interpret the results will be assessed. The vote (out of thirty) will weigh 60% on the final judgment.
-
questionnaire with multiple choice answers to test the preparation on the theoretical aspects of the overall program. The student's knowledge of some key concepts concerning both the design and the analysis of clinical studies will be evaluated. The vote (out of thirty) will weigh 40% on the final judgment.
No in-course evaluations are planned.
Office hours
On request by e-mail.