Informazioni sul corso | Introduzione a Machine Learning per Fisici

Syllabus del corso

Italiano ‎(it)‎
English ‎(en)‎

Esporta

Obiettivi

Questo corso introduce i principi fondamentali del Machine Learning attraverso la lente della fisica. Superando l'approccio "scatola nera" (black-box), esploreremo come i diversi algoritmi di Deep Learning vengano progettati e implementati nella ricerca. Gli studenti acquisiranno esperienza pratica applicando questi strumenti a svariati set di dati — inclusi gli eventi registrati dai rivelatori di fisica delle particelle, le onde gravitationali e le immagini astronomiche, mediche o ambientali — per poi concludere con un progetto finale basato su un test di ipotesi statistica. L'obiettivo è padroneggiare sia il "come" funzionano gli algoritmi, sia il "perché" della loro applicazione nelle scienze fisiche.

Contenuti sintetici

1. La cassetta degli attrezzi del fisico e fondamenti statistici
Dalla verosimiglianza alla perdita (Loss): Il Lemma di Neyman-Pearson; Strutture dati e Pre-elaborazione dei dati.

2. Shallow Learning e alberi di decisione
Boosted Decision Trees (BDT); Validazione in un regime a statistica limitata; Metriche per la scoperta.

3. Deep Learning: simmetrie e architetture
Deep Neural Networks (DNN); Convolutional Neural Networks (CNN); Graph Neural Networks (GNN).

4. Dati sequenziali e modelli generativi
Serie temporali (RNN e Attention); Modelli generativi: VAE (Autoencoder Variazionali), Modelli di diffusione e Normalizing Flows.

5. Inferenza statistica e il "risultato fisico"
Anomaly Detection (Rilevamento delle anomalie); Limit Setting (Definizione dei limiti); Teorema di Wilks.

Programma esteso

1. La cassetta degli attrezzi del fisico e fondamenti statistici

Dalla verosimiglianza alla perdita (Loss): Il Lemma di Neyman-Pearson come fondamento del Machine Learning, dimostrando che la Binary Cross-Entropy (entropia incrociata binaria) è la log-verosimiglianza negativa di un processo di Bernoulli.
Strutture dati: Andare oltre le tabelle (es. array di NumPy o dataframe di Pandas). Introduzione agli Awkward Arrays per dati di fisica "irregolari" (ragged, con numero variabile di particelle per evento) e a uproot per l'integrazione dei file di ROOT.
Pre-elaborazione dei dati: Standardizzazione, gestione del mascheramento dei rivelatori/valori anomali (outliers) e importanza delle unità di misura fisiche nella riscalatura (scaling).

2. Shallow Learning e alberi di decisione

Boosted Decision Trees (BDT): Perché rimangono la "baseline" (linea di riferimento) in diverse applicazioni scientifiche. Introduzione a XGBoost e LightGBM.
Validazione in un regime a statistica limitata: K-folding, verifiche di overtraining (sovrallenamento) e il bilanciamento tra Bias e Variance (compromesso bias-varianza).
Metriche per la scoperta: Passare dall'accuratezza (Accuracy) alle curve ROC, alla purezza (Purity), all'efficienza (Efficiency) e alla significatività (Significance).

3. Deep Learning: simmetrie e architetture

Deep Neural Networks (DNN): Ottimizzazione tramite discesa del gradiente, utilizzando la Backpropagation (retropropagazione dell'errore) e la regola della catena (Chain Rule, interpretata come calcolo differenziale).
Convolutional Neural Networks (CNN): Elaborazione delle immagini nei telescopi, calorimetri, satelliti e nella diagnostica medica.
Graph Neural Networks (GNN): Risoluzione di problemi di riconoscimento di pattern (pattern recognition) nella fisica delle particelle.

4. Dati sequenziali e modelli generativi

Serie temporali (RNN e Attention): Analisi degli impulsi elettronici nei rivelatori di particelle (es. LArTPC) o dei dati di deformazione (strain) delle onde gravitationali (es. LIGO). Introduzione al meccanismo di attenzione (Attention).
Modelli generativi:
VAE (Autoencoder Variazionali): Riduzione della dimensionalità e fisica dello spazio latente.
Modelli di diffusione e Normalizing Flows: Stima della densità condizionale e loro applicazione per la simulazione veloce dei rivelatori.

5. Inferenza statistica e il "risultato fisico"

Anomaly Detection (Rilevamento delle anomalie): Apprendimento non supervisionato (Autoencoder) per la ricerca di "Nuova Fisica" in assenza di un modello teorico.
Limit Setting (Definizione dei limiti): Utilizzo dei punteggi (score) del Machine Learning come input per i fit di verosimiglianza profilo (Profile Likelihood Fits).
Teorema di Wilks: Traduzione delle prestazioni del Machine Learning in significatività espressa in "Sigma" (σ).

Prerequisiti

Laboratorio di Calcolo e Statistica. Le competenze e le conoscenze acquisite durante questo corso, sia sulla programmazione in Python che sui metodi statistici, sono considerate fondamentali e saranno date per assunte.

Modalità didattica

Lezioni: 50% Teoria / 50% Laboratorio pratico di programmazione (Hands-on).

Materiale didattico

“Hands-On Machine Learning with Scikit-Learn and PyTorch” - Aurélien Géron (2025) - N.B. In biblioteca è disponibile una vecchia edizione dello stesso autore che copre i medesimi argomenti, intitolata “Hands-On Machine Learning with Scikit-Learn, Keras and Tensorflow”
“Understanding Deep Learning” - Simon Prince
Goodfellow, Bengio e Courville, “Deep Learning”, MIT Press
“Pen and Paper Exercises in Machine Learning” - arXiv:2206.13446

Periodo di erogazione dell'insegnamento

Secondo semestre

Modalità di verifica del profitto e valutazione

Agli studenti verrà fornito un set di dati "alla cieca" (blind dataset) e dovranno completare uno specifico compito di analisi ideato dai docenti. Il progetto richiede il soddisfacimento di una serie di obiettivi tecnici e la documentazione del processo in una relazione scritta formale. Ogni relazione sarà valutata in base alla sua chiarezza, all'intuizione fisica e alla completezza. In seguito alla valutazione positiva della relazione, gli studenti accederanno a una prova orale. Questa sessione inizierà con una discussione tecnica sul progetto dello studente, per poi ampliarsi in un esame approfondito su qualsiasi argomento trattato durante il corso.

Orario di ricevimento

Il ricevimento si tiene su appuntamento, da concordare preventivamente via e-mail con il docente.

Sustainable Development Goals

ISTRUZIONE DI QUALITÁ | PARITÁ DI GENERE | IMPRESE, INNOVAZIONE E INFRASTRUTTURE

Esporta

Aims

This course introduces the fundamental principles of Machine Learning through the lens of
physics. We move beyond the 'black-box' approach to explore how various Deep Learning
algorithms are designed and deployed in research. Students will gain practical experience
applying these tools to diverse datasets—including events recorded by particle physics
detectors, Gravitational Waves, as well as astronomical, medical, or environmental
imagery—culminating in a statistical hypothesis-test project. The goal is to master both the 'how'
of the algorithms and the 'why' of their application in the physical sciences.

1. The Physicist’s Toolkit & Statistical Foundations
From Likelihoods to Loss: The Neyman-Pearson Lemma; Data Structures and Data Preprocessing.

2. Shallow Learning & Decision Trees
Boosted Decision Trees (BDTs) and their Validation in a Statistically-Limited Regime; Metrics for Discovery.

3. Deep Learning: Symmetries & Architectures
Deep Neural Networks (DNNs), Convolutional Neural Networks (CNNs) and Graph Neural Networks (GNNs) with examples.

4. Sequential Data & Generative Models
Time-Series (RNNs & Attention); Generative Models: Variational AutoEncoders, Diffusion Models & Normalizing Flows.

5. Statistical Inference & "The Physics Output"
Anomaly Detection; Limit Setting; Wilks’ Theorem.

Detailed program

1. The Physicist’s Toolkit & Statistical Foundations

From Likelihoods to Loss: The Neyman-Pearson Lemma as the foundation of ML, proving that Binary Cross-Entropy is the Negative Log-Likelihood of a Bernoulli process.
Data Structures: Moving beyond tables (e.g. numpy arrays or pandas dataframes). Introduction to Awkward Arrays for "ragged" physics data (varying particles per event) and uproot for ROOT file integration.
Data Preprocessing: Standardization, handling detector masking/outliers, and the importance of physical units in scaling.

2. Shallow Learning & Decision Trees

Boosted Decision Trees (BDTs): Why they remain the "baseline" in several scientific applications. Introduction to XGBoost/LightGBM.
Validation in a Statistically-Limited Regime: K-folding, overtraining checks, and the Bias-Variance tradeoff.
Metrics for Discovery: Moving from "Accuracy" to ROC curves, Purity, Efficiency, and Significance.

3. Deep Learning: Symmetries & Architectures

Deep Neural Networks (DNNs): Optimisation by Gradient descent, using Backpropagation and the Chain Rule (interpreted as differential calculus).
Convolutional Neural Networks (CNNs): Image processing in telescopes, calorimeters, satellites, and medical diagnostic.
Graph Neural Networks (GNNs): solve pattern recognition problems in particle physics.

4. Sequential Data & Generative Models

Time-Series (RNNs & Attention): Analyzing electronic pulses by particle detectors (e.g. LArTPC) or Gravitational Waves strain data (e.g. LIGO). Introduction to the "Attention" mechanism.
Generative Models:
VAEs: Dimensionality reduction and latent space physics.
Diffusion Models & Normalizing Flows: Conditional density estimation and ther application to fast detector simulation.

5. Statistical Inference & "The Physics Output"

Anomaly Detection: Unsupervised learning (Autoencoders) to search for "New Physics" without a theoretical model.
Limit Setting: Using ML scores as input to Profile Likelihood Fits.
Wilks’ Theorem: Translating ML performance into "Sigma" (σ) significance.

Prerequisites

Laboratory of Calculus and Statistics. The competencies and knowledge acquired during this course, on both python programming and statistical methods, are considered fundamental and will be assumed.

Teaching form

Lectures: 50% Theory / 50% Hands-on Coding Lab.

Textbook and teaching resource

“Hands-On Machine Learning with Scikit-Learn and PyTorch” - Aurelien Genon (2025) - n.b. an older edition covering the same topics is “Hands-On Machine Learning with Scikit-Learn, Keras and Tensorflow” from the same author is available at the library
“Understanding Deep Learning” - Simon Prince
Goodfellow, Bengio and Courville, Deep Learning, MIT Press
Pen and Paper Exercises in Machine Learning - arXiv:2206.13446

Semester

Second

Assessment method

Students will be provided with a "blind" dataset and must complete a specific analysis task designed by the instructors. The project requires fulfilling a set of technical objectives and documenting the process in a formal written report. Each report will be evaluated based on its clarity, physical insight, and completeness. Upon successful assessment of the report, students will proceed to an oral examination. This session will begin with a technical discussion of the student’s project before expanding into a comprehensive review of any topic covered during the course.

Office hours

Office hours are held by appointment, to be arranged in advance with the professor via email.

Sustainable Development Goals

QUALITY EDUCATION | GENDER EQUALITY | INDUSTRY, INNOVATION AND INFRASTRUCTURE

Syllabus del corso

Obiettivi

Contenuti sintetici

Programma esteso

Prerequisiti

Modalità didattica

Materiale didattico

Periodo di erogazione dell'insegnamento

Modalità di verifica del profitto e valutazione

Orario di ricevimento

Sustainable Development Goals

Aims

Contents

Detailed program

Prerequisites

Teaching form

Textbook and teaching resource

Semester

Assessment method

Office hours

Sustainable Development Goals

Scheda del corso

Staff

Docente

Opinione studenti

Bibliografia

Metodi di iscrizione

Obiettivi di sviluppo sostenibile