- Area di Scienze
- Corso di Laurea Triennale
- Informatica [E3102Q - E3101Q]
- Insegnamenti
- A.A. 2025-2026
- 2° anno
- Probabilità e Statistica per l'Informatica
- Introduzione
Syllabus del corso
Obiettivi
Obiettivi formativi (Descrittori di Dublino)
Al termine del corso, lo studente avrà raggiunto i seguenti risultati di apprendimento:
1. Conoscenza e capacità di comprensione. Lo studente acquisirà le conoscenze di base nel campo del calcolo delle probabilità e della statistica matematica, comprendendone linguaggio, definizioni e principali risultati. Particolare attenzione sarà dedicata alle distribuzioni di probabilità più comuni e ai fondamenti della statistica descrittiva e inferenziale.
2. Capacità di applicare conoscenza e comprensione. Lo studente sarà in grado di applicare i concetti teorici per analizzare fenomeni aleatori, condurre ragionamenti in condizioni di incertezza e descrivere sinteticamente insiemi di dati. Sarà inoltre in grado di stimare parametri e verificare ipotesi statistiche in contesti applicativi.
3. Autonomia di giudizio. Lo studente svilupperà la capacità di valutare criticamente i modelli probabilistici e statistici utilizzati, scegliendo metodi adeguati per l’analisi e l’interpretazione dei dati.
4. Abilità comunicative. Lo studente sarà in grado di comunicare in modo chiaro e rigoroso concetti e risultati relativi alla probabilità e alla statistica, sia in forma scritta che orale, utilizzando un linguaggio appropriato al contesto informatico.
5. Capacità di apprendimento. Lo studente acquisirà le competenze necessarie per approfondire autonomamente lo studio della probabilità e della statistica, anche attraverso l’uso di strumenti software, con particolare riferimento al linguaggio di programmazione R.
Contenuti sintetici
La prima parte del corso, dedicata al calcolo delle probabilità, si apre con la statistica descrittiva, che permette di sintetizzare le informazioni salienti relative a un insieme di dati. Vengono quindi presentati gli spazi di probabilità, che sono alla base della descrizione matematica dei fenomeni aleatori, e le variabili aleatorie, che ne costituiscono il "linguaggio operativo".
La seconda parte del corso, dedicata alla statistica matematica, si apre con i teoremi di convergenza (legge dei grandi numeri e teorema limite centrale) che descrivono il comportamento di fenomeni aleatori con un grande numero di componenti. Vengono presentate le tecniche principali per la stima di parametri in un modello probabilistico e viene discussa la verifica di ipotesi e i corrispondenti test statistici, sia relativi a parametri incogniti in un modello aleatorio (test parametrici) sia relativi al confronto di distribuzioni (test non parametrici). Il corso si conclude con la regressione lineare, una tecnica importante per studiare il legame che può sussistere tra una variabile (output) e un insieme di variabili (input) in condizioni di incertezza.
Programma esteso
1. Statistica descrittiva
- Introduzione all'analisi dei dati
- Statistiche campionarie (media, mediana, quantili, varianza, correlazione)
- Rappresentazioni grafiche
2. Spazi di probabilità
- Fenomeni aleatori, spazi di probabilità ed eventi
- Proprietà di base della probabilità
- Probabilità condizionata
- Elementi di calcolo combinatorio
- Indipendenza di eventi
3. Variabili aleatorie
- Variabili aleatorie discrete
- Valore medio, momenti, varianza e covarianza
- Variabili aleatorie assolutamente continue
- Distribuzioni notevoli discrete e assolutamente continue
- Variabili aleatorie normali
4. Teoremi di convergenza
- Convergenza di variabili aleatorie e distribuzioni (cenni)
- Legge dei grandi numeri
- Teorema limite centrale
5. Stima di parametri
- Campioni e statistiche
- Stimatori (media e varianza campionarie)
- Intervalli di confidenza
6. Verifica di ipotesi
- Test per la verifica di un'ipotesi, errori di I e II specie
- Test parametrici per media e varianza
- Test non parametrici di buon adattamento e di indipendenza
7. Regressione lineare
- Introduzione alla regressione
- Inferenza statistica sui parametri
- Analisi dei residui
Prerequisiti
Le conoscenze, competenze e abilità impartite negli insegnamenti precedenti di matematica, in particolare di Analisi Matematica.
Modalità didattica
Il corso viene erogato in lingua Italiana in modalità blended-learning.
Le lezioni frontali sono articolate nel modo seguente:
- 16 lezioni teoriche da 2 ore svolte in modalità erogativa in presenza, in cui si fornisce la conoscenza di definizioni, risultati, dimostrazioni ed esempi rilevanti;
- 10 esercitazioni da 2 ore svolte in modalità erogativa in presenza, in cui si forniscono competenze e abilità necessaire per utilizzare le nozioni teoriche per la risoluzione di esercizi.
La parte blended del corso (laboratorio con R) consiste in esercitazioni con il software R svolte in modalità interattiva da remoto, in cui si acquisiscono le competenze e abilità necessarie per effettuare analisi statistiche con l'uso di R. Le esercitazioni sono organizzate in sette sessioni distinte (una per ciascun argomento del corso) che prevedono un impegno di circa 3 h 30 min a sessione.
Materiale didattico
Testo di riferimento:
- S. M. Ross (2014), Introduzione alla Statistica, seconda edicione, Apogeo Editore
Inoltre, viene reso disponibile il seguente materiale didattico:
- Appunti dei docenti
- Fogli di esercizi
Laboratorio con R
- video lezioni e appunti
Periodo di erogazione dell'insegnamento
Secondo semestre
Modalità di verifica del profitto e valutazione
L'esame è costituito da una prova scritta e da una eventuale prova orale e riceve un voto in trentesimi.
La prova scritta è costituita da due parti:
- una prima parte con domande a risposta chiusa, che contribuisce per un terzo al punteggio totale, in cui vengono valutate le conoscenze teoriche;
- una seconda parte con esercizi a risposta aperta, che contribuiscono per due terzi al punteggio totale, in cui vengono valutate le abilità pratiche.
È prevista una prova parziale a metà del corso. Il primo appello d'esame coincide con la seconda prova parziale ed è riservato a chi abbia superato la prima.
La prova orale è facoltativa (su richiesta dello studente e/o del docente) e può contribuire sia in maniera positiva che in maniera negativa al voto finale.
È previsto un progetto con il software "R", da svolgere secondo le modalità descritte all'inizio del corso, dal valore di 2 punti.
Orario di ricevimento
Su appuntamento
Sustainable Development Goals
Aims
Learning Objectives (Dublin Descriptors)
At the end of the course, students will have achieved the following learning outcomes:
1. Knowledge and Understanding. Students will acquire basic knowledge in probability theory and mathematical statistics, including fundamental concepts, definitions, and key results. Particular emphasis will be placed on the most relevant probability distributions and on the foundations of descriptive and inferential statistics.
2. Applying Knowledge and Understanding. Students will be able to apply theoretical concepts to analyze random phenomena, reason under uncertainty, and effectively summarize data sets. They will also be able to perform parameter estimation and hypothesis testing in practical contexts.
3. Making Judgements. Students will develop the ability to critically assess probabilistic and statistical models, selecting appropriate methods for data analysis and interpretation.
4. Communication Skills. Students will be able to communicate concepts and results related to probability and statistics in a clear and rigorous manner, both in written and oral form, using terminology appropriate to the field of computer science.
5. Learning Skills. Students will develop the necessary skills to independently deepen their knowledge of probability and statistics, including through the use of software tools, with particular reference to the R programming language.
Contents
The first part of the course, devoted to probability theory, starts with an introduction to the so-called descriptive statistics which allows to summarize the salient features of some data set. Subsequently we present probability spaces, a key concept in the modeling of random phenomena, along with random variables which form its "operating language".
The second part of the course, devoted to mathematical statistics, starts with the main limit theorems (law of large numbers and central limit theorem) which describe the behavior of random phenomena with a large number of components. Then we discuss hypothesis testing and the corresponding statistical tests, concerning both unknown parameters in a random model (parametric tests) and the comparison between distributions (non-parametric tests). The last part of the course is devoted to the linear regression, a powerful technique to investigate the link that might exist between some variable (output) and a given set of variables (input) under uncertainty.
Detailed program
1. Descriptive Statistics
- Introduction to data analysis
- Sample statistics (mean, median, quantiles, variance, correlation)
- Graphical representations
2. Probability spaces
- Random phenomena, probability spaces and events
- Basic properties of probability
- Conditional probability
- Elements of combinatorial calculus
- Independence of events
3. Random variables
- Discrete random variables
- Expectation, moments, variance and covariance
- Absolutely continuous random variables
- Important discrete and absolutely continuous distributions
- Normal random variables
4. Convergence Theorems
- Convergence of random variables and distribuitons (hints)
- Law of Large Numbers
- Central Limit Theorem
5. Parameters Estimation
- Samples and statistics
- Estimators (sample mean and variance)
- Confidence intervals
6. Hypothesis Testing
- Hypothesis testing, I type and II type errors
- Parametric hypothesis testing for mean and variance
- Non parametric hypothesis testing for goodness of fit and independence
7. Linear Regression
- Introduction to linear regression
- Statistical inference for parameters
- Residual analysis
Prerequisites
The knowledge, competences and skills taught in previous mathematical courses, in particular concerning Mathematical Analysis.
Teaching form
The course is given in Italian in blended-learning.
Lectures in the classroom are organized as follows:
- 16 x 2 hours of in-person, lecture-based teaching (theoretical lectures, delivered mode) focused on the knowledge of definitions, results, proofs and relevant examples;
- 10 x 2 hours of in-person, lecture-based exercise classes (recitations, delivered mode) focused on the skills necessary to apply the theoretical knowledge and competencies to the solution of exercises.
The blended part of the course (computer workshops with R) consists of on-line practical sessions with the software R in interactive mode, focused on the skills required to do statistical analysis with R. This activity is organized into seven distinct workshops (one for each topic of the course) which require a commitment of approximately 3 hours 30 minutes per session.
Textbook and teaching resource
Reference book:
- S. M. Ross (2014), Introduzione alla Statistica, seconda edicione, Apogeo Editore
Moreover, the following teaching material is made avaliable:
- Theacher's notes
- Exercise sheets
Computer workshops with R
- video lectures and slides
Semester
Spring term (Second semester)
Assessment method
The exam consists of a written part and of a possible oral part. It receives a mark out of 30.
The written part consists of two parts:
- a first part of closed-ended questions, which contributes one third to the final mark, where theoretical skills are tested;
- a second part of open questions, which contributes two thirds to the final mark, where practical skills are tested.
A midterm exam is scheduled halfway through the course. The first exam session coincides with the second midterm and is reserved for students who passed the first one.
The oral part is optional (or at the request of the student and/or of the teacher) and can increase or decrease the final mark.
A project using R software is available, to be carried out according to the guidelines provided at the beginning of the course. It is worth 2 points.
Office hours
By appointment
Sustainable Development Goals
Scheda del corso
Staff
-
Francesco Caravenna
-
Guglielmo Lulli
-
Federica Masiero
-
Maurizia Rossi