- Causal Networks
- Summary
Course Syllabus
Obiettivi
Il corso mira a fornire un’introduzione graduale all’inferenza causale e in particolare alle reti causali e ai modelli causali strutturali. In particolare, il corso fornisce forti motivazioni e perché, allo stato dell’arte attuale, i metodi di apprendimento automatico hanno bisogno della causalità e di strumenti di modellazione causale per affrontare correttamente e risolvere efficacemente problemi di decisione in condizioni di incertezza, Inoltre, il corso fornisce strumenti matematici e strumenti software per condurre ragionamento causale (DdD 1, DdD 2).
Inoltre, l'organizzazione della prova d'esame, tramite la realizzazione di un programma e la presentazione di un articilo scientifico assegnato da parte del docente consentirà al candidato di sviluppare capacità critica (DdD 3), di comunicazione (DdD 4), mentre la disponibilià di materiale da leggere, suggerito dal docente durante il corso, consentirà al candidato di proseguire in modo autonomo lo studio e l'approfondimento della materia (DdD 5).
Contenuti sintetici
Contenuti principali del corso; il framework teorico delle potential outcomes, le definizioni di base e le proprietà dei modelli grafici probabilistici con specifico riferimento alle reti bayesiane, reti causali e modelli causali strutturali, esperimenti randomizzati, identificazione non parametrica dell’effetto causale, stima dell’effetto causale, confondimento non osservato, variabili strumentali, apprendimento strutturale dai dati osservazionali e combinando dati osservazionali e dati ottenuti tramite esperimenti randomizzati controllati, concetti di trasferimento di apprendimento e trasportabilità, e infine una breve introduzione ai controfattuali.
Programma esteso
- Introduzione alla causalità e perché la causalità è importante
- Potential Outcomes; il problema fondamentale dell’inferenza causale, ITE, ATE, proprietà principali come ignorabilità, interscambiabilità, …
- Reti bayesiane; definizione, collider, catena e forca, fattorizzazione, …
- Modelli causali; do.operator, aggiustamento del backdoor, modelli causali strutturali.
- Sperimentazioni controllate randomizzate; comparabilità e bilanciamento delle covariate, interscambiabilità, nessun percorso backdoor.
- Identificazione non parametrica; aggiustamento del frontdoor, identificazione dalla struttura del grafo.
- Stima; modellizzazione condizionale dell’outcome, modellizzazione causale condizionale raggruppata, punteggio di propensione e pesatura della probabilità inversa.
- Confondimento non osservato; nessun vincolo di assunzioni, selezione ottimale del trattamento, analisi di sensibilità.
- Variabili strumentali; identificazione non parametrica di ATE, identificazione non parametrica di ATE locale.
- Causal discovery da dati osservazionali; algoritmi basati su vincoli e basati su punteggio.
- Causal discovery da dati sperimentali; interventi strutturali, interventi parametrici, equivalenza di Markov di intervento.
- Trasferimento e trasportabilità.
- Controfattuali
Prerequisiti
Conoscenze base di
- teoria dei grafi
- ottimizzazione
- probabilità e statistica
- linguaggi di programmazione R e Python.
Modalità didattica
Il corso è organizzato come segue:
- 18 lezioni da 2 ore di teoria di natura erogativa in presenza
- 5 lezioni da 2 ore di esercitazione di natura interattiva in presenza
- 4 seminari online da un'ora l'uno di natura erogativa e interattiva
Materiale didattico
Slides del docente e materiale di lettura suggerito dal docente
Periodo di erogazione dell'insegnamento
Primo semestre, inizio ottobre
Modalità di verifica del profitto e valutazione
L'esame è strutturato come segue:
- Project work; Lo studente è invitato a sviluppare un programma software che implementi un algoritmo descritto in un articolo scientifico assegnato dal docente. (Assegna un massimo di 8 punti).
- Colloquio sulla relazione di laboratorio; Sui temi non presentati direttamente durante il corso. In particolare, presentazione orale di 15 minuti in cui vengono riassunti i contenuti di un articolo scientifico della letteratura specializzata (assegna un massimo di 15 punti) e successiva discussione sugli argomenti principali del corso (assegna un massimo di 10 punti).
Non sono previste prove intermedie.
Orario di ricevimento
Inviare un messaggio a fabio.stella@unimib.it
Aims
The course aims to provide a gentle introduction to causal inference and in particular to causal newtworks and structural causal models.
In particular, the course gives strong motivations because, at the current state-of-the-art, modern machine learning experts need causality, and tools from causal modeling, to correctly address and effectively solve problems of decision making under uncertainty. Furthermore, the course gives mathematical tools and software tools to perform causal reasoning (DdD 1, DdD 2).
Moreover, the organization of the exam, through the development of a program and the presentation of a scientific article assigned by the instructor, will allow the candidate to develop critical thinking skills (DdD 3) and communication skills (DdD 4), while the availability of reading materials suggested by the instructor during the course will enable the candidate to continue studying and deepening their understanding of the subject independently (DdD 5).
Contents
The main contents are as follows; the potential outcome framework, basic definitions and properties of probabilistic graphical models with specific reference to Bayesian networks, causal networks and structural causal models, randomized experiments, nonparametric identification of causal effect, estimation of causal effect, unobserved confounding, instrumental variables, structural learning from observational data and from observational and intervention data, basic concepts of tranfer learning and transportability, and finally a basic introduction to counterfactuals.
Detailed program
- Introduction to causality and why causality matters
- The potential outcome framework; the fundamental problem of causal inference, ITE, ATE, main properties as ignorability, exchangeability, ...
- Bayesian networks; definition, collider, chain and fork, factorization, ...
- Causal models; do.operator, backdoor adjustement, structural causal models.
- Randomized control trials; comparability and covariate bancing, exchangeability, no backdoor paths.
- Nonparametric identification; frontdoor adjustment, identification from the graph structure.
- Estimation; conditional outcome modeling, grouped conditional causal modeling, propensity score and inverse probability weighting.
- Unobserved counfounding; no assumptions bound, optimal treatment selection, sensitivity analysis.
- Instrumental variables; nonparametric identification of ATE, nonparametric identification of local ATE.
- Causal discovery from observational data; constraint-based and score-based algorithms.
- Causal discovery from interventional data; structure interventions, parametric interventions, interventional Markov equivalence.
- Transfer learning and transportability.
- Counterfactuals.
Prerequisites
Basic knowledge of:
- graph theory,
- optimization,
- probability and statistics,
- programming; mainly R and Python.
Teaching form
The course is organized as follows:
- 18 lectures of 2 hours each of theory in physical presence of erogative nature
- 5 lectures of 2 hours each of hands-on in physical presence of interactive nature
- 4 online seminars of 1 hour each of erogative and interactive nature
Textbook and teaching resource
Slides from teachers and additional reading material.
Semester
First semester, early october.
Assessment method
The exam is structured as follows:
- Project work; the student is asked to develop a software program implementing one algorithm described by a scientific paper assigned by the teacher. (awards a maximum of 8 points).
- Interview on project work; on topics not directly presented during the course. In particular, oral presentation of 15 minutes when the contents of a specialized literature scientific paper are summarized (awards a maximum of 15 points) and subsequent discussion on the mai topics of the course (awards a maximum of 10 points).
No interim assessments are scheduled.
Office hours
Just drop me an email message at fabio.stella@unimib.it