- Area Economico-Statistica
- Corso di Laurea Magistrale
- Biostatistica [F8203B]
- Insegnamenti
- A.A. 2024-2025
- 1° anno
- Inferenza Statistica
- Introduzione
Syllabus del corso
Obiettivi formativi
L'insegnamento si propone di presentare concetti e metodi avanzati dell’inferenza statistica, con particolare riguardo a problemi di stima e di verifica d'ipotesi. Allo studente verranno forniti gli strumenti per l'analisi e l'elaborazione dei dati campionari, con la duplice finalità di fornire elementi di supporto alle decisioni e di permettere l'applicazione di modelli complessi. Lo studente acquisirà inoltre gli strumenti per la comprensione di metodologie inferenziali più specifiche, sviluppate in altri insegnamenti del percorso universitario.
Questo insegnamento fornirà conoscenze e capacità di comprensione relativamente a:
- Quali sono le principali metodologie di stima dei parametri di una distribuzione o di un modello e quali sono i loro punti di forza e di debolezza.
- Quali problematiche emergono dall'applicazione pratica di tali metodologie; in particolare, quale ruolo è rappresentato dalle assunzioni su cui si basano.
- Quali problematiche emergono quando tali metodologie vengono applicate per produrre decisioni.
Alla fine dell’insegnamento gli studenti saranno in grado di:
- Individuare la tecnica inferenziale più adatta ad un certo contesto o ad un certo modello. In particolare, gli studenti sapranno distinguere tra tecniche basate unicamente sul concetto di verosimiglianza e tecniche che incorporano le opinioni iniziali (cosiddette tecniche bayesiane).
- Comprendere il significato e i limiti dei risultati ottenuti da terze parti mediante l'impiego di specifiche tecniche inferenziali.
- Implementare le tecniche inferenziali conosciute in contesti non banali da un punto di vista analitico, eventualmente ricorrendo a metodi di approssimazione numerica o a procedure di simulazione.
- Affrontare problemi inferenziali in cui le assunzioni classiche sono violate, eventualmente ricorrendo a tecniche non basate su particolari distribuzioni (cosiddette tecniche non parametriche).
- Comprendere gli argomenti sviluppati in altri insegnamenti del percorso universitario focalizzati sull'uso di modelli statistici, sulla statistica bayesiana e sulla statistica computazionale.
Contenuti sintetici
Stima puntuale: criteri di ottimalità degli stimatori, principali metodi di stima. Stima intervallare. Verifica di ipotesi: criteri di ottimalità dei test, metodi per ricercare test. Metodi nonparametrici. Applicazioni in SAS.
Programma esteso
Campionamento e distribuzioni campionarie. Campionamento da popolazioni Normali. Convergenza di sequenze di variabili aleatorie. Teoremi limite e loro applicazioni. Simulazione di distribuzioni campionarie mediante il metodo Monte Carlo. Principi di riduzione delle informazioni campionarie: sufficienza, sufficienza minimale, ancillarità, completezza. Funzione di verosimiglianza e principio di verosimiglianza. Stima puntuale e metodi per cercare stimatori: metodo dei momenti, metodo della massima verosimiglianza, stimatori Bayesiani, algoritmo EM. Ottimalità degli stimatori: disuguaglianza di Cramér-Rao, teorema di Rao-Blackwell, teorema di Lehman-Scheffé. Stima intervallare: quantità pivotali, intervalli di credibilità Bayesiani, probabilità di copertura. Verifica di ipotesi: test basati sul rapporto di verosimiglianze, test Bayesiani, test unione-intersezione, ottimalità dei test. Valutazioni asintotiche e robustezza: consistenza, metodo Bootstrap, intervalli basati su grandi campioni, test asintotici basati sul rapporto di verosimiglianze. Procedure SAS per i principali test parametrici e nonparametrici.
Prerequisiti
Nessun prerequisito formale. E' comunque consigliato, a chi proviene da una formazione pregressa non quantitativa, seguire le lezioni di "Introduzione all'inferenza statistica".
Metodi didattici
21 lezioni (teoria ed esempi) da 2 ore svolte in modalità erogativa in presenza.
Modalità di verifica dell'apprendimento
L’esame prevede un colloquio orale che, benché di natura prevalentemente teorica, ha anche lo scopo di sondare la capacità dello studente di risolvere semplici problemi inferenziali. Verranno cioè cioè sondate la conoscenza e la comprensione delle tecniche inferenziali trattate, ma anche le capacità di applicare tali tecniche ad uno specifico problema e di interpretare i risultati ottenuti. Inoltre, verrà verificata la capacità di esprimersi con un linguaggio tecnico adeguato.
Non esiste distinzione formale tra le modalità d'esame per gli studenti frequentanti e non frequentanti. Tuttavia, durante il periodo di erogazione del corso, gli studenti possono svolgere degli assignment, ossia dei lavori da svolgersi autonomamente a casa. La partecipazione agli assignment è libera, ossia non prevede l'obbligo di frequenza e la gestione avviene tramite la piattaforma e-learning. Gli assignment comprendono esercizi, domande di approfondimento sulla teoria e applicazioni tramite il software SAS. Gli studenti che ottengono una valutazione sufficiente negli assignment potranno sostituire una parte (circa un terzo) della prova orale e il voto finale sarà ottenuto come media ponderata.
Testi di riferimento
Indicazioni sui testi di riferimento verranno fornite all'inizio delle lezioni.
Periodo di erogazione dell'insegnamento
2° semestre - 3° ciclo
Lingua di insegnamento
Italiano
Learning objectives
The course aims at introducing advanced methods of inferential statistics, mainly with respect to estimation and hypothesis testing. Students will learn the main tools to analyze and to process sample data, aiming both at supporting decisions and at applying complex models. Students will also get the ability to understand more specific inferential procedures, which are the content of other courses in the degree programme.
This course will provide knowledge and understanding related to:
- The main methods to estimate the parameters of a distribution or of a model, along with the virtues and vices of each method
- The problems arising when the methods above are applied; markedly, what limitations derive from the assumptions on which they are based
- The challenges arising when the methods above are used to produce decisions
At the end of the course, students will be able:
- To Locate the suitable inferential tool for a given framework or a given model. Specifically, students will distinguish among techniques based on the concept of likelihood and those which can incorporate prior knowledge (so called bayesian techniques)
- To interpret and to locate the flaws of ready results which other users obtained by specific inferential techniques
- To implement the main inferential methods in some analytically intractable frameworks, possibly by reverting to numerical approximations or to simulations
- To face with inferential problems where the usual assumptions are violated, possibly by reverting to suitable techniques which are not based on specific distributions (so called nonparametric techniques)
- To understand the contents of other courses of the programme, which are focused on the use of statistical models, on bayesian statistics or on computational statistics.
Contents
Point estimation: optimality, main estimation methods. Interval estimation. Hypothesis testing: optimality, main methods to find tests. Nonparametric methods. Applications with SAS.
Detailed program
Samples and sampling distributions. Sampling from the Normal distribution. Convergences of sequences of random variables. Limit theorems and their applications. Simulation of sampling distributions by the Monte Carlo method. Principles of data reduction: sufficiency, minimal sufficiency, ancillary, completeness. Likelihood functions and the likelihood principle. Point estimation and methods of finding estimators: method of moments, method of maximum likelihood, Bayes estimators, the EM algorithm. Optimality of estimators: Cramer-Rao inequality, Rao-Blackwell theorem, Lehman-Scheffé theorem. Interval estimation: pivotal quantities, Bayesian intervals, coverage probability. Testing hypotheses: likelihood-ratio tests, Bayes tests, union-intersection tests, optimality of tests. Asymptotic evaluation and robustness: consistency, Bootstrap, large-sample intervals, asymptotic likelihood-ratio tests. SAS procedures for the main parametric and nonparametric tests.
Prerequisites
No formal prerequisites. In any case, for students who don't have a quantitative formation, it is recommended to take the course of "Introduction to statistical inference".
Teaching methods
21 2-hour lessons (theory and examples) held in direct-teaching mode and carried out in presence.
Assessment methods
The exam includes an oral interview which, although of a predominantly theoretical nature, also ckecks the student's ability to solve simple inferential problems. In other words, the knowledge and understanding of the inferential techniques treated will be tested, as well as the ability to apply these techniques to a specific problem and to interpret the results obtained. Furthermore, the ability to use a suitable technical language will be tested.
There is no formal distinction between the assessment methods for students attending and those not attending lessons. However, during the period of lessons, students can decide to solve some assignments to be done at home. Participation to the assignments is free, namely there is no mandatory need to attend lessons and the assignments are administered trough the e-learning. The assignments deal with exercises, developments about theory and applications by the SAS software. Students who get sufficient marks in the assignments can substitute a part (about a third) of the oral test and the final mark is obtained as a weighted average.
Textbooks and Reading Materials
Details about textbooks will be provided at the start of lessons.
Semester
2nd semester - 3rd period
Teaching language
Italian