- Statistical Inference
- Summary
Course Syllabus
Obiettivi formativi
L'insegnamento si propone di presentare concetti e metodi avanzati dell’inferenza statistica, con particolare riguardo a problemi di stima e di verifica d'ipotesi. Allo studente verranno forniti gli strumenti per l'analisi e l'elaborazione dei dati campionari, con la duplice finalità di fornire elementi di supporto alle decisioni e di permettere l'applicazione di modelli complessi. Lo studente acquisirà inoltre gli strumenti per la comprensione di metodologie inferenziali più specifiche, sviluppate in altri insegnamenti del percorso universitario.
Gli obiettivi specifici del corso sono così declinabili:
- conoscenza e capacità di comprensione: lo studente dovrà conoscere le principali metodologie di stima dei parametri di una distribuzione o di un modello e quali sono i loro punti di forza e di debolezza; dovrà conoscere le principali metodologie statistiche per produrre decisioni sulla scorta dei dati; dovrà conoscere i criteri con cui valutare l’ottimalità delle metodologie statistiche di stima e di verifica d’ipotesi
- conoscenza e capacità di comprensione applicate: lo studente dovrà saper Individuare la tecnica inferenziale più adatta ad un certo contesto o ad un certo modello; dovrà saper implementare le tecniche inferenziali note in contesti non banali da un punto di vista analitico, eventualmente ricorrendo a metodi di approssimazione numerica o a procedure di simulazione; dovrà saper affrontare problemi inferenziali in cui le assunzioni classiche sono violate, eventualmente ricorrendo a tecniche non basate su particolari distribuzioni (cosiddette tecniche non parametriche).
- autonomia di giudizio: lo studente dovrà conoscere quali problematiche emergano dall'applicazione delle metodologie inferenziali; in particolare, dovrà essere consapevole delle limitazioni rappresentate dal mancato soddisfacimento delle assunzioni su cui le metodologie si basano; dovrà comprendere il significato e i limiti dei risultati ottenuti da terze parti mediante l'impiego di tecniche inferenziali
- abilità comunicative: lo studente dovrà saper proporre e spiegare le metodologie inferenziali per produrre giudizi o decisioni; dovrà saper esporre la distinzione tra tecniche basate unicamente sul concetto di verosimiglianza e tecniche che incorporano opinioni soggettive.
- capacità di apprendere: lo studente dovrà saper comprendere gli argomenti sviluppati in altri insegnamenti del percorso universitario focalizzati sull'uso di modelli statistici, sulla statistica bayesiana e sulla statistica computazionale
Contenuti sintetici
Stima puntuale: criteri di ottimalità degli stimatori, principali metodi di stima. Stima intervallare. Verifica di ipotesi: criteri di ottimalità dei test, metodi per ricercare test. Metodi nonparametrici. Applicazioni in SAS.
Programma esteso
Campionamento e distribuzioni campionarie. Campionamento da popolazioni Normali. Convergenza di sequenze di variabili aleatorie. Teoremi limite e loro applicazioni. Simulazione di distribuzioni campionarie mediante il metodo Monte Carlo. Principi di riduzione delle informazioni campionarie: sufficienza, sufficienza minimale, ancillarità, completezza. Funzione di verosimiglianza e principio di verosimiglianza. Stima puntuale e metodi per cercare stimatori: metodo dei momenti, metodo della massima verosimiglianza, stimatori Bayesiani, algoritmo EM. Ottimalità degli stimatori: disuguaglianza di Cramér-Rao, teorema di Rao-Blackwell, teorema di Lehman-Scheffé. Stima intervallare: quantità pivotali, intervalli di credibilità Bayesiani, probabilità di copertura. Verifica di ipotesi: test basati sul rapporto di verosimiglianze, test Bayesiani, test unione-intersezione, ottimalità dei test. Valutazioni asintotiche e robustezza: consistenza, metodo Bootstrap, intervalli basati su grandi campioni, test asintotici basati sul rapporto di verosimiglianze. Procedure SAS per i principali test parametrici e nonparametrici.
Prerequisiti
Nessun prerequisito formale. E' comunque consigliato, a chi proviene da una formazione pregressa non quantitativa, seguire le lezioni di "Introduzione all'inferenza statistica".
Metodi didattici
21 lezioni (teoria ed esempi) da 2 ore svolte in modalità erogativa in presenza.
Modalità di verifica dell'apprendimento
L’esame prevede un colloquio orale che, benché di natura prevalentemente teorica, ha anche lo scopo di sondare la capacità dello studente di risolvere semplici problemi inferenziali. Verranno cioè cioè sondate la conoscenza e la comprensione delle tecniche inferenziali trattate, ma anche le capacità di applicare tali tecniche ad uno specifico problema e di interpretare i risultati ottenuti. Inoltre, verrà verificata la capacità di esprimersi con un linguaggio tecnico adeguato.
Non esiste distinzione formale tra le modalità d'esame per gli studenti frequentanti e non frequentanti. Tuttavia, durante il periodo di erogazione del corso, gli studenti possono svolgere degli assignment, ossia dei lavori da svolgersi autonomamente a casa. La partecipazione agli assignment è libera, ossia non prevede l'obbligo di frequenza e la gestione avviene tramite la piattaforma e-learning. Gli assignment comprendono esercizi, domande di approfondimento sulla teoria e applicazioni tramite il software SAS. Gli studenti che ottengono una valutazione sufficiente negli assignment potranno sostituire una parte (circa un terzo) della prova orale e il voto finale sarà ottenuto come media ponderata.
Testi di riferimento
Indicazioni sui testi di riferimento verranno fornite all'inizio delle lezioni.
Periodo di erogazione dell'insegnamento
2° semestre - 3° ciclo
Lingua di insegnamento
Italiano
Learning objectives
The course aims at introducing advanced methods of inferential statistics, mainly with respect to estimation and hypothesis testing. Students will learn the main tools to analyze and to process sampling data, aiming both at supporting decisions and at applying complex models. Students will also get the ability to understand more specific inferential procedures, which are the content of other courses in the degree programme.
Specific goals of the course are as follows:
- knowledge and understanding: students should know the main methods to estimate the parameters of a distribution or of a model, along with their strengths and weaknesses; students should know the main statistical techniques to produce decisions based on data; students should know the criteria used to assess the optimality of the statistical methodologies used for estimation and testing
- applied knowledge and understanding: students should be able to locate the suitable inferential tool for a given framework or a given model; students should be able to implement the known inferential methods in some analytically intractable frameworks, possibly by reverting to numerical approximations or to simulations; students should be able to face with inferential problems where the usual assumptions are violated, possibly by reverting to suitable techniques which are not based on specific distributions (so called nonparametric techniques)
- making judgements: students should understand the challenges arising when the inferential methods are applied; markedly, students should be aware of the limitations derived from the fulfilment of the basic assumptions of some methodologies; students should be able to interpret and to locate the flaws of inferential results produced by third parties
- communication skills: students should be able to propose and to explain some inferential tools aimed at making judgments and decisions; students should be able to explain the distinction among the techniques based on the concept of likelihood and those which can also incorporate subjective knowledge
- learning skills: students should be able to understand the contents of other courses of the degree programme, which are focused on the use of statistical models, on bayesian statistics or on computational statistics
Contents
Point estimation: optimality, main estimation methods. Interval estimation. Hypothesis testing: optimality, main methods to find tests. Nonparametric methods. Applications with SAS.
Detailed program
Samples and sampling distributions. Sampling from the Normal distribution. Convergences of sequences of random variables. Limit theorems and their applications. Simulation of sampling distributions by the Monte Carlo method. Principles of data reduction: sufficiency, minimal sufficiency, ancillary, completeness. Likelihood functions and the likelihood principle. Point estimation and methods of finding estimators: method of moments, method of maximum likelihood, Bayes estimators, the EM algorithm. Optimality of estimators: Cramer-Rao inequality, Rao-Blackwell theorem, Lehman-Scheffé theorem. Interval estimation: pivotal quantities, Bayesian intervals, coverage probability. Testing hypotheses: likelihood-ratio tests, Bayes tests, union-intersection tests, optimality of tests. Asymptotic evaluation and robustness: consistency, Bootstrap, large-sample intervals, asymptotic likelihood-ratio tests. SAS procedures for the main parametric and nonparametric tests.
Prerequisites
No formal prerequisites. In any case, for students who don't have a quantitative formation, it is recommended to take the course of "Introduction to statistical inference".
Teaching methods
21 2-hour lessons (theory and examples) held in direct-teaching mode and carried out in presence.
Assessment methods
The exam includes an oral interview which, although of a predominantly theoretical nature, also ckecks the student's ability to solve simple inferential problems. In other words, the knowledge and understanding of the inferential techniques treated will be tested, as well as the ability to apply these techniques to a specific problem and to interpret the results obtained. Furthermore, the ability to use a suitable technical language will be tested.
There is no formal distinction between the assessment methods for students attending and those not attending lessons. However, during the period of lessons, students can decide to solve some assignments to be done at home. Participation to the assignments is free, namely there is no mandatory need to attend lessons and the assignments are administered trough the e-learning. The assignments deal with exercises, developments about theory and applications by the SAS software. Students who get sufficient marks in the assignments can substitute a part (about a third) of the oral test and the final mark is obtained as a weighted average.
Textbooks and Reading Materials
Details about textbooks will be provided at the start of lessons.
Semester
2nd semester - 3rd period
Teaching language
Italian