- Mathematical Statistics
- Summary
Course Syllabus
Obiettivi
Conoscere e comprendere gli strumenti di base della statistica inferenziale.
Essere in grado di applicare tali conoscenze a situazioni in cui si ha un campione di osservazioni, al fine di fornire, dopo una opportuna scelta del modello aleatorio, stime su parametri incogniti e opinioni motivate sulle proprietà di tali parametri.
Contenuti sintetici
Modelli statistici. Statistica inferenziale: stimatori, intervalli di confidenza, test d'ipotesi.
Programma esteso
Il programma è uguale per frequentanti e non frequentanti.
Introduzione alla statistica
- Popolazione obiettivo, campione casuale. Problema del campionamento. Statistica. Densità dipendenti da parametri incogniti.
Stime puntuali di parametri
- Stimatore, stimatore non distorto, errore quadratico medio, consistenza in media quadratica, condizione necessaria e sufficiente per la consistenza in media quadratica di una successione di stimatori.
- Stimatori per i momenti di una VA: momenti campionari. Media campionaria.
- Stimatore non distorto della varianza: varianza campionaria.
- Metodo dei momenti per la costruzione di stimatori.
- Funzione di verosimiglianza. Stimatore di massima verosimiglianza.
- Stimatore UMVUE; limite inferiore della varianza (disuguaglianza di Cramér-Rao).
- Proprietà di invarianza degli stimatori di massima verosimiglianza. Proprietà asintotiche degli stimatori di massima verosimiglianza.
- Campionamento da v.a. Normali: legge della media campionaria. Legge del quadrato di una Normale(0,1): legge chi quadro a 1 grado di libertà. Legge della somma dei quadrati di normali standard indipendenti: legge chi quadro a k gradi di libertà. Legge della varianza campionaria di un campione normale. Legge t di Student.
Stime intervallari
- Intervalli di confidenza: definizione, livello di confidenza.
- Intervalli per la media di popolazione normale (varianza nota o incognita).
- Intervalli per la varianza di popolazione normale (media nota o incognita).
- Quantità pivotale e suo utilizzo per il calcolo di intervalli di confidenza.
- Intervalli di confidenza per grandi campioni (in particolare per frequenze ovvero parametri di Bernoulli).
- Quantità pivotale per campioni provenienti da legge assolutamente continua.
Test d'ipotesi
- Test per un'ipotesi statistica; test non casualizzato e regione critica. Livello di significatività, p-value. Test uniformemente più potente di livello fissato.
- Test per una media di popolazione normale (varianza nota oppure ignota).
- Test per la varianza di una popolazione normale (media nota o ignota).
- Test per differenza di medie per popolazioni normali.
- Confronto fra intervalli e test.
- Test su una frequenza e su due frequenze (campione numeroso).
- Test del rapporto di verosimiglianza semplice e generalizzato. Teorema di Neyman-Pearson.
- Test chi quadrato di Pearson per l'adattamento (con o senza parametri stimati).
- Test chi quadrato di Pearson per l'indipendenza.
Regressione lineare
- Regressione lineare semplice e multipla: definizione, interpretazione, test.
Prerequisiti
Analisi matematica I e II, in particolare calcolo integrale.
Probabilità di base: leggi di variabili aleatorie discrete e continue. Valore atteso e varianza. Legge di funzioni di variabili aleatorie. Indipendenza. Convergenza di successioni di variabili aleatorie.
Modalità didattica
Durante l'emergenza COVID le lezioni saranno fornite tramite registrazioni in modo asincrono, più eventi in diretta in videoconferenza.
In caso di fine dell'emergenza, la modalità didattica consiste di lezioni ed esercizi in aula.
In ogni caso gli studenti sono invitati ad esercitarsi a casa con gli esercizi che vengono forniti tramite la piattaforma elearning (alcuni dei quali vengono proposti a lezione e che fanno da modello per gli esercizi richiesti in sede d'esame).
Materiale didattico
Libro di testo:
Introduzione alla statistica di A.M.Mood, F.A.Graybill, D.C.Boes, 1991, McGraw-Hill Italia,ISBN: 9788838606618
Altro materiale: slide delle lezioni e degli esercizi su elearning.unimib.it
Periodo di erogazione dell'insegnamento
Secondo semestre.
Modalità di verifica del profitto e valutazione
Esame scritto con:
- domande a scelta multipla (sui concetti teorici descritti nel corso)
- domande a risposta aperta (sui concetti teorici descritti nel corso, ivi comprese le richieste di enunciare una definizione e/o enunciare e dimostrare teoremi)
- esercizi scritti: applicazione dei concetti teorici e di tecniche analoghe agli esercizi proposti a lezione e per casa.
Durante l'emergenza COVID, la parte di domande di teoria a risposta aperta non verrà di regola inserita nello scritto, ma verrà valutata nella prova orale che diviene obbligatoria per tutti gli studenti. Sono ammessi alla prova orale tutti gli studenti con votazione maggiore o uguale a 16/30 nello scritto. La prova orale viene attuata da remoto tramite videoconferenza.
Per i dettagli tecnici dell'esame da remoto, gli studenti interessati sono invitati a leggere gli avvisi relativi nella pagina del corso.
In caso di fine dell'emergenza, le domande di teoria sono inserite nella prova scritta e l'orale è a richiesta del docente e/o dello studente ed è un colloquio sullo scritto, sugli argomenti svolti a lezione ed eventualmente di approfondimento sulla parte della regressione lineare. Nell'orale sono valutate le stesse qualità delle risposte che sono valutate nello scritto. Gli studenti con votazione insufficiente ma maggiore o uguale a 16/30 nello scritto possono richiedere di sostenere l'orale, così come tutti gli altri studenti con votazione sufficiente. In caso di sostenimento della prova orale, il peso dello scritto è di 3/4 e quello dell'orale di 1/4. Di norma i voti sufficienti (compreso il massimo dei voti) possono essere confermati senza prova orale, fermo restando la facoltà del docente di chiedere una prova orale in tutte le situazioni in cui ravvisi la necessità di chiarimenti riguardo alla prova scritta.
Orario di ricevimento
Su appuntamento.
Aims
Knowledge of the basic tools of inferential statistics.
Acquire the ability of applying this knowledge to situation where we have a sample of observations, in order to provide, after a proper choice of the random model, estimates of the unknown parameters and reasonable oinions on the properties of these parameters.
Contents
Statistical models. Inferential statistics: estimators, confidence intervals, hypothesis testing.
Detailed program
The program is the same for attending and non-attending students
Introduction to Statistics
- Target population, random sample. Sampling problem. Statistics. Density dependent on unknown parameters.
Point estimation of parameters
- Estimator, unbiased estimator, mean square error, consistency in quadratic mean, necessary and sufficient condition for the consistency in quadratic mean of a sequence of estimators.
- Estimators for the moments of a VA: sample moments. Sample mean.
- Unbiased estimator of the variance: sample variance.
- Method of moments for the construction of estimators.
- Likelihood function. Maximum likelihood estimator.
- UMVUE, the lower limit of variance (Cramér-Rao).
- Invariance property of maximum likelihood estimators. Asymptotic properties of maximum likelihood estimators.
- Sampling from Normal random variables: the law of the sample mean. Square law of a Normal (0,1): chi-square law with 1 degree of freedom. Law of the sum of squares of independent standard normals: Chi-square law with k degrees of freedom. Law of the sample variance of a normal sample. Student's t law.
Confidence intervals
- Definition, confidence level.
- Intervals for the mean of the normal population (known or unknown variance).
- Intervals for the variance of the normal population (mean known or unknown).
- Pivotal quantity and its use for the calculation of confidence intervals.
- Confidence intervals for large samples (especially for frequencies or parameters of Bernoulli).
- Pivotal quantity for samples from the absolutely continuous laws.
Hypothesis testing
- Tests for statistical hypothesis, non-randomized tests and the critical region. Significance level, the p-value. Uniformly more powerful tests.
- Test for a mean of the normal population (variance known or unknown).
- Test for the variance of a normal population (mean known or unknown).
- Test for difference of means for normal populations.
- Test on a frequency and on two frequencies (large sample).
- Test of simple and generalized likelihood ratio. Neyman-Pearson Theorem.
- Pearson chi-square test for adaptation (with or without parameters estimated).
- Pearson chi-square test for Independence.
Linear regression
- Simple and multiple linear regression: definition, interpretation, testing.
Prerequisites
Mathematical analysis I and II, in particular integral calculus.
Basic probability: laws of discrete and continuous random variables. Expected value and variance. Law of functions of random variables. Independence. Convergence of sequences of random variables.
Teaching form
During the COVID emergency, lessons will be provided as asyncronous videos on the elearning platform, plus live events through videoconferences.
In case of end of the Emergency, lessons and exercises will be provided in the classroom.
In any case students are advised to exercise at home with the exercises which are provided through the elearning Platform (some of those exercises are discussed during the lessons and are a model for the exercises which are given during examinations).
Textbook and teaching resource
Textbook:
Introduzione alla statistica di A.M.Mood, F.A.Graybill, D.C.Boes, 1991, McGraw-Hill Italia,ISBN: 9788838606618
Other material: slides of the lessons and the exercises on elearning.unimib.it
Semester
Second semester.
Assessment method
Written exam with
- multiple choiche questions (on the theoretical aspects described in the course)
- open questions (on the theoretical aspects described in the course, includeing the requirement of writing definitions and statement and proof of theorems)
- written exercises: application of the theoretical concepts and of techniques like the ones used in the exercises which are assigned in the classroom and at home.
During the COVID emergency, the open questions on the theoretical aspects of the course are not inserted in the written examination, but are evaluated during the oral examination which is compulsory for all students. All students with evaluation equal or higher than 16/30 are admitted to the oral examination. The oral examination will take place through videoconference.
For the technical details of remote exams, please check the notices broadcasted in the forum of the elearning page.
In case of end of the emergency, the open questions on the theoretical aspects are inserted in the written exam and the oral examination may be required by the student and/or the teacher and is a discussion based on the written examination, on the subjects treated during the lessons and eventually on the subject of the linear regression. In the oral examination we evaluate the same qualities of the answers of the written part. Students with an insufficient evaluation but larger or equal to 16/30 may ask to be evaluated orally, and so may all the other students with positive evaluation in the written examination. In case of an oral examination, its mark will have a weight of 1/4 (and 3/4 for the written part). Usually sufficient marks (including the maximum of the gradings) may be confirmed without an oral examination, but the teacher can request an oral examination in all the situations where she judges necessary to ask for explanations on the written exam.
During the year there are 5 examination, usually in the following months: June, July, September, November and January (or February).
Office hours
By appointment.