Skip to main content
If you continue browsing this website, you agree to our policies:
  • Condizioni di utilizzo e trattamento dei dati
Continue
x
e-Learning - UNIMIB
  • Home
  • My Media
  • More
Listen to this page using ReadSpeaker
 Log in
e-Learning - UNIMIB
Home My Media
Expand all Collapse all
Percorso della pagina
  1. Science
  2. Master Degree
  3. Astrophysics and Space Physics [F5803Q - F5802Q]
  4. Courses
  5. A.Y. 2021-2022
  6. 1st year
  1. Astrostatistics
  2. Summary
Insegnamento Course full name
Astrostatistics
Course ID number
2122-1-F5802Q014
Course summary SYLLABUS

Course Syllabus

  • Italiano ‎(it)‎
  • English ‎(en)‎
Export

Obiettivi

L'uso della statistica e' fra i fondamenti dell'astronomia e dell'astrofisica moderna. Strumenti statistici sempre piu' sofisticati sono ora disponibili su larga scala, spesso indicati coi nomi di "data mining", "machine learning" e "intelligenza artificiale".  Il corso fornisce un'introduzione ad alcune di queste tecniche statistiche in una modalita' molto pratica, alternando derivazioni teoriche ed applicazioni computazionali. Nonostante gli esempi trattati verrano presi esclusivamente dal campo dell'astrofisica, questo corso e' appropriato per tutti gli studenti magistrali del corso di laurea in Fisica interessati a tecniche avanzate di statistica e machine learning.


Contenuti sintetici

Programma esteso

Argomenti di statistica e data mining:

- Breve sunto di probabilita' ed inferenza.
- Inferenza Bayesiana (ruolo delle priors, differenze e somiglianze con l'approccio frequentista, selezione di modelli, MCMC).
- Identificazione di strutture nei dati (algoritmi di clustering, estimatori parametrici e non parametrici).
- Riduzione dimensionale (ad esempio Principal Component Analysis).
- Problemi di regressione (overfitting, processi Gaussiani).
- Problemi di classificazione (reti neurali, curve ROC).
- Deep learning.
- Analisi di serie temporali.

Alcuni esempi di dataset astrofisici (lista indicativa):

- Sloan Digital Sky Survey. Dataset con 357 milioni di sorgenti and 1.6 milioni di spettri.
- LINEAR database. Datasets con migliaia di stelle variabili.
- Serie temporali dal Laser Interferometer Gravitational-Wave observatory (LIGO), che ha rivelato piu' di 50 eventi di onde gravitazionali.
- Dati di parallaxes dal satellite GAIA.


Prerequisiti

Non ci sono prerequisiti formali. Una conoscenza di medio livello del linguaggio di programmazione Python è però altamente raccomandata (vedi sotto per alcune risorse di ripasso).

Modalità didattica

Lezioni, 6 crediti.

Materiale didattico

Testo principale:

- "Statistics, Data Mining, and Machine Learning in Astronomy", Željko, Andrew, Jacob, and Gray. Princeton University Press, 2012.
- Software: https://www.astroml.org/

Altre risorse:

- "Statistical Data Analysis", Cowan. Oxford Science Publications, 1997
- "Data Analysis: A Bayesian Tutorial", Sivia and Skilling. Oxford Science Publications, 2006
-  "Bayesian Data Analysis", Gelman, Carlin, Stern, Dunson, Vehtari, and Rubin. Chapman & Hall, 2013. Distribuito gratuitamente: http://www.stat.columbia.edu/~gelman/book/
- "Python Data Science Handbook", VanderPlas. O'Reilly Media, 2016. Distribuito gratuitamente: https://jakevdp.github.io/PythonDataScienceHandbook/
- "Practical Statistics for Astronomers", Wall and Jenkins. Cambridge University Press, 2003

- "Bayesian Logical Data Analysis for the Physical Sciences", Gregory. Cambridge University Press, 2005
- "Modern Statistical Methods For Astronomy" Feigelson and Babu. Cambridge University Press, 2012
- "Information theory, inference, and learning algorithms" MacKay. Cambridge University Press, 2003. Distribuito gratuitamente: https://www.inference.org.uk/mackay/itila/book.html
- “Data analysis recipes", Hogg et al.: 
 - https://arxiv.org/abs/0807.4820
 - https://arxiv.org/abs/1008.4686
 - https://arxiv.org/abs/1205.4446
 - https://arxiv.org/abs/1710.06068
 - https://arxiv.org/abs/2005.14199

Risorse di ripasso sul linguaggio di programmazione Python:

- https://github.com/jrjohansson/scientific-python-lectures
- https://astrofrog.github.io/py4sci/
- "Learning Scientific Programming with Python", Hill, Cambridge University Press, 2020. https://scipython.com/

Periodo di erogazione dell'insegnamento

Secondo semestre.

Modalità di verifica del profitto e valutazione

L'esame verra' valutato con una prova orale. Un esercizio computazionale verra' assegnato prima dell'esame. Gli studenti dovranno portarlo completato alla prova orale dove verra' discusso col docente. Gli studenti dovranno poi sostenere domande di approfondimento sugli argomenti del corso.

Tutte le lezioni e gli esami si terranno in lingua inglese. 

Orario di ricevimento

Sempre, se non mi trovate in ufficio contattatemi via email per un appuntamento. 

Export

Aims

The use of statistics is ubiquitous in astronomy and astrophysics. Modern advances are made possible by the application of increasingly sophisticated tools, often dubbed as "data mining", "machine learning", and "artificial intelligence". This class provides an introduction to (some of) these statistical techniques in a very practical fashion, pairing formal derivations to hands-on computational applications. Although examples will be taken almost exclusively from the realm of astronomy, this class is appropriate to all Physics students interested in machine learning.

Contents

Detailed program

Statistics topic covered:

- Brief recap on probability and statistical inference.
- Bayesian inference (role of priors, difference and similarities with the frequentist approach, model selection, MCMC).
- Looking for structure in the data (cluster algorithms, parametric vs non-parametric estimators).
- Dimensionality reduction (e.g. Principal Component Analysis).
- Regression problems (overfitting, gaussian process regression).
- Classification problems (neural networks, ROC curves).
- Deep learning.
- Time-series analyses.

Some examples of astrophysical datasets we might use include (TBC):

- Data from the Sloan Digital Sky Survey. Large dataset with 357 million unique sources and 1.6 million follow-up spectra.
- The LINEAR database, containing time-domain observations of thousands of variable stars.
- Time series data from the Laser Interferometer Gravitational-Wave observatory (LIGO), which has detected more than 50 gravitational wave events.
- Parallaxes data from the GAIA satellite.

Prerequisites

No formal prerequisites. Some previous knowledge of the python programming language is highly recommended (see below for some catch-up resources).

Teaching form

Lessons, 6 credits.

Textbook and teaching resource

Main textbook:

- "Statistics, Data Mining, and Machine Learning in Astronomy", Željko, Andrew, Jacob, and Gray. Princeton University Press, 2012.
- Supporting software: https://www.astroml.org/

Other relevant resources:

- "Statistical Data Analysis", Cowan. Oxford Science Publications, 1997
- "Data Analysis: A Bayesian Tutorial", Sivia and Skilling. Oxford Science Publications, 2006
-  "Bayesian Data Analysis", Gelman, Carlin, Stern, Dunson, Vehtari, and Rubin. Chapman & Hall, 2013. Free: http://www.stat.columbia.edu/~gelman/book/
- "Python Data Science Handbook", VanderPlas. O'Reilly Media, 2016. Free: https://jakevdp.github.io/PythonDataScienceHandbook/
- "Practical Statistics for Astronomers", Wall and Jenkins. Cambridge University Press, 2003

- "Bayesian Logical Data Analysis for the Physical Sciences", Gregory. Cambridge University Press, 2005
- "Modern Statistical Methods For Astronomy" Feigelson and Babu. Cambridge University Press, 2012
- "Information theory, inference, and learning algorithms" MacKay. Cambridge University Press, 2003. Free: 
https://www.inference.org.uk/mackay/itila/book.html

- “Data analysis recipes", Hogg et al.: 
  - https://arxiv.org/abs/0807.4820
  - https://arxiv.org/abs/1008.4686
  - https://arxiv.org/abs/1205.4446
  - https://arxiv.org/abs/1710.06068
  - https://arxiv.org/abs/2005.14199

Catch-up resources for students who need to refresh their Python skills:

 - https://github.com/jrjohansson/scientific-python-lectures
 - https://astrofrog.github.io/py4sci/
 - "Learning Scientific Programming with Python", Hill, Cambridge University Press, 2020. https://scipython.com/

Semester

Second semester.

Assessment method

The class will be assessed with an oral exam. A computational problem will be assigned beforehand; students will need to complete it in their own time and discuss it during the exam. 

All classes, excercises, and exams will be in English. 

Office hours

Any time, please contact me by email.

Enter

Key information

Field of research
FIS/05
ECTS
6
Term
Second semester
Activity type
Mandatory to be chosen
Course Length (Hours)
42
Language
English

Staff

    Teacher

  • DG
    Davide Gerosa

Students' opinion

View previous A.Y. opinion

Bibliography

Find the books for this course in the Library

Enrolment methods

Self enrolment (Student)
Manual enrolments
Guest access

You are not logged in. (Log in)
Policies
Get the mobile app
Powered by Moodle
© 2025 Università degli Studi di Milano-Bicocca
  • Privacy policy
  • Accessibility
  • Statistics