- Causal Networks
- Summary
Course Syllabus
Obiettivi
Il corso mira a fornire un’introduzione graduale all’inferenza causale e in particolare alle reti causali e ai modelli causali strutturali. In particolare, il corso fornisce forti motivazioni e perché, allo stato dell’arte attuale, i metodi di apprendimento automatico hanno bisogno della causalità e di strumenti di modellazione causale per affrontare correttamente e risolvere efficacemente problemi di decisione in condizioni di incertezza.
Contenuti sintetici
Contenuti principali del corso; il framework teorico delle potential outcomes, le definizioni di base e le proprietà dei modelli grafici probabilistici con specifico riferimento alle reti bayesiane, reti causali e modelli causali strutturali, esperimenti randomizzati, identificazione non parametrica dell’effetto causale, stima dell’effetto causale, confondimento non osservato, variabili strumentali, apprendimento strutturale dai dati osservazionali e combinando dati osservazionali e dati ottenuti tramite esperimenti randomizzati controllati, concetti di trasferimento di apprendimento e trasportabilità, e infine una breve introduzione ai controfattuali.
Programma esteso
- Introduzione alla causalità e perché la causalità è importante
- Potential Outcomes; il problema fondamentale dell’inferenza causale, ITE, ATE, proprietà principali come ignorabilità, interscambiabilità, …
- Reti bayesiane; definizione, collider, catena e forca, fattorizzazione, …
- Modelli causali; do.operator, aggiustamento del backdoor, modelli causali strutturali.
- Sperimentazioni controllate randomizzate; comparabilità e bilanciamento delle covariate, interscambiabilità, nessun percorso backdoor.
- Identificazione non parametrica; aggiustamento del frontdoor, identificazione dalla struttura del grafo.
- Stima; modellizzazione condizionale dell’outcome, modellizzazione causale condizionale raggruppata, punteggio di propensione e pesatura della probabilità inversa.
- Confondimento non osservato; nessun vincolo di assunzioni, selezione ottimale del trattamento, analisi di sensibilità.
- Variabili strumentali; identificazione non parametrica di ATE, identificazione non parametrica di ATE locale.
- Causal discovery da dati osservazionali; algoritmi basati su vincoli e basati su punteggio.
- Causal discovery da dati sperimentali; interventi strutturali, interventi parametrici, equivalenza di Markov di intervento.
- Trasferimento e trasportabilità.
- Controfattuali
Prerequisiti
Conoscenze base di
- teoria dei grafi
- ottimizzazione
- probabilità e statistica
- linguaggi di programmazione R e Python.
Modalità didattica
Il corso è organizzato come segue:
- 18 lezioni da 2 ore di teoria di natura erogativa in presenza
- 5 lezioni da 2 ore di esercitazione di natura interattiva in presenza
- 4 seminari online da un'ora l'uno di natura erogativa e interattiva
Materiale didattico
Slides del docente e materiale di lettura suggerito dal docente
Periodo di erogazione dell'insegnamento
Primo semestre, inizio ottobre
Modalità di verifica del profitto e valutazione
L'esame è strutturato come segue:
- Project work; Lo studente è invitato a sviluppare un programma software che implementi un algoritmo descritto in un articolo scientifico assegnato dal docente. (Assegna un massimo di 8 punti).
- Presentazione orale e discussione; Sui temi non presentati direttamente durante il corso. In particolare, presentazione orale di 15 minuti in cui vengono riassunti i contenuti di un articolo scientifico della letteratura specializzata (assegna un massimo di 15 punti) e successiva discussione sugli argomenti principali del corso (assegna un massimo di 10 punti).
Orario di ricevimento
Inviare un messaggio a fabio.stella@unimib.it
Aims
The course aims to provide a gentle introduction to causal inference and in particular to causal newtworks and structural causal models.
In particular, the course gives strong motivations because, at the current state-of-the-art, modern machine learning experts need causality, and tools from causal modeling, to correctly address and effectively solve problems of decision making under uncertainty.
Contents
The main contents are as follows; the potential outcome framework, basic definitions and properties of probabilistic graphical models with specific reference to Bayesian networks, causal networks and structural causal models, randomized experiments, nonparametric identification of causal effect, estimation of causal effect, unobserved confounding, instrumental variables, structural learning from observational data and from observational and intervention data, basic concepts of tranfer learning and transportability, and finally a basic introduction to counterfactuals.
Detailed program
- Introduction to causality and why causality matters
- The potential outcome framework; the fundamental problem of causal inference, ITE, ATE, main properties as ignorability, exchangeability, ...
- Bayesian networks; definition, collider, chain and fork, factorization, ...
- Causal models; do.operator, backdoor adjustement, structural causal models.
- Randomized control trials; comparability and covariate bancing, exchangeability, no backdoor paths.
- Nonparametric identification; frontdoor adjustment, identification from the graph structure.
- Estimation; conditional outcome modeling, grouped conditional causal modeling, propensity score and inverse probability weighting.
- Unobserved counfounding; no assumptions bound, optimal treatment selection, sensitivity analysis.
- Instrumental variables; nonparametric identification of ATE, nonparametric identification of local ATE.
- Causal discovery from observational data; constraint-based and score-based algorithms.
- Causal discovery from interventional data; structure interventions, parametric interventions, interventional Markov equivalence.
- Transfer learning and transportability.
- Counterfactuals.
Prerequisites
Basic knowledge of:
- graph theory,
- optimization,
- probability and statistics,
- programming; mainly R and Python.
Teaching form
The course is organized as follows:
- 18 lectures of 2 hours each of theory in physical presence of erogative nature
- 5 lectures of 2 hours each of hands-on in physical presence of interactive nature
- 4 online seminars of 1 hour each of erogative and interactive nature
Textbook and teaching resource
Slides from teachers and additional reading material.
Semester
First semester, early october.
Assessment method
The exam is structured as follows:
- Project work; the student is asked to develop a software program implementing one algorithm described by a scientific paper assigned by the teacher. (awards a maximum of 8 points)
- Oral presentation and discussion; on topics not directly presented during the course. In particular, oral presentation of 15 minutes when the contents of a specialized literature scientific paper are summarized (awards a maximum of 15 points) and subsequent discussion on the mai topics of the course (awards a maximum of 10 points).
Office hours
Just drop me an email message at fabio.stella@unimib.it