- Mathematical Statistics
- Summary
Course Syllabus
Obiettivi
Conoscere e comprendere gli strumenti di base della statistica inferenziale.
Essere in grado di applicare, anche utilizzando software specifico, tali conoscenze a situazioni in cui si ha un campione di osservazioni, al fine di fornire, dopo una opportuna scelta del modello aleatorio, stime su parametri incogniti e opinioni motivate sulle proprietà di tali parametri.
Contenuti sintetici
Modelli statistici. Statistica inferenziale: stimatori, intervalli di confidenza, test d'ipotesi. Utilizzo di software specifici queli R o di fogli di calcolo
Programma esteso
Il programma è uguale per frequentanti e non frequentanti.
Introduzione alla statistica
Popolazione obiettivo, campione casuale. Problema del campionamento. Statistica. Densità dipendenti da parametri incogniti.
Stime puntuali di parametri
Stimatore, stimatore non distorto, errore quadratico medio, consistenza in media quadratica, condizione necessaria e sufficiente per la consistenza in media quadratica di una successione di stimatori.
Stimatori per i momenti di una VA: momenti campionari. Media campionaria.
Stimatore non distorto della varianza: varianza campionaria.
Metodo dei momenti per la costruzione di stimatori.
Funzione di verosimiglianza. Stimatore di massima verosimiglianza.
Stimatore UMVUE; limite inferiore della varianza (disuguaglianza di Cramér-Rao).
Proprietà di invarianza degli stimatori di massima verosimiglianza. Proprietà asintotiche degli stimatori di massima verosimiglianza.
Campionamento da v.a. Normali: legge della media campionaria. Legge del quadrato di una Normale(0,1): legge chi quadro a 1 grado di libertà. Legge della somma dei quadrati di normali standard indipendenti: legge chi quadro a k gradi di libertà. Legge della varianza campionaria di un campione normale. Legge t di Student.
Stime intervallari
Intervalli di confidenza: definizione, livello di confidenza.
Intervalli per la media di popolazione normale (varianza nota o incognita).
Intervalli per la varianza di popolazione normale (media nota o incognita).
Quantità pivotale e suo utilizzo per il calcolo di intervalli di confidenza.
Intervalli di confidenza per grandi campioni (in particolare per frequenze ovvero parametri di Bernoulli).
Quantità pivotale per campioni provenienti da legge assolutamente continua.
Test d'ipotesi
Test per un'ipotesi statistica; test non casualizzato e regione critica. Livello di significatività, p-value. Test uniformemente più potente di livello fissato.
Test per una media di popolazione normale (varianza nota oppure ignota).
Test per la varianza di una popolazione normale (media nota o ignota).
Test per differenza di medie per popolazioni normali.
Confronto fra intervalli e test.
Test su una frequenza e su due frequenze (campione numeroso).
Test del rapporto di verosimiglianza semplice e generalizzato. Teorema di Neyman-Pearson.
Test chi quadrato di Pearson per l'adattamento (con o senza parametri stimati).
Test chi quadrato di Pearson per l'indipendenza.
Regressione lineare
Regressione lineare semplice e multipla: definizione, interpretazione, test.
Prerequisiti
Analisi matematica I e II, in particolare calcolo integrale.
Probabilità di base: leggi di variabili aleatorie discrete e continue. Valore atteso e varianza. Legge di funzioni di variabili aleatorie. Indipendenza. Convergenza di successioni di variabili aleatorie.
Modalità didattica
Si utilizza un approccio didattico ibrido che combina didattica frontale (DE) e didattica interattiva (DI). La DE include la presentazione e spiegazione dettagliata dei contenuti teorici. La DI prevede interventi attivi degli studenti tramite esercizi e problemi, brevi interventi, discussioni collettive e lavori di gruppo o individuali anche utilizzando software statistico (es. R). Non è possibile stabilire precisamente a priori il numero di ore dedicate alla DE e alla DI, poiché le modalità si intrecciano in modo dinamico per adattarsi alle esigenze del corso e favorire un apprendimento partecipativo e integrato, combinando teoria e pratica.
Le lezioni (48 ore 6 cfu) si svolgono in presenza e sono tenute in italiano. Su richiesta e previo accordo tra docente e studenti sarà possibile l'utilizzo della lingua inglese.
Compatibilmente con gli strumenti di registrazione a disposizione le lezioni saranno registrate e messe a disposizione sul sito di e-learning.
Compatibilmente con la disponibilità di laboratori informatici il 20% del corso avrà contenuto laboratoriale tramite l'uso di software statistico
Materiale didattico
Introduzione alla statistica di A.M.Mood, F.A.Graybill, D.C.Boes, 1991, McGraw-Hill Italia,ISBN: 9788838606618
An Introduction to Mathematica Statistics: F. Bijma, M. Jonker, A. van der Vart, Amsterdam University Press
Altro materiale: slide delle lezioni e degli esercizi su elearning.unimib.it
Periodo di erogazione dell'insegnamento
Secondo semestre
Modalità di verifica del profitto e valutazione
Esame scritto con:
- domande a risposta aperta (sui concetti teorici descritti nel corso, ivi comprese le richieste di enunciare una definizione e/o enunciare e dimostrare teoremi)
- esercizi scritti: applicazione dei concetti teorici e di tecniche analoghe agli esercizi proposti a lezione e per casa.
presentazione - presentazione di una relazione su un problema da analizzare a casa
Per le parte 1. non è consentito tenere materiale didattico, mentre per la parte 2. è consentito l'utilizzo di un formulario autoprodotto scritto su un foglio A4 (fronte e retro), oltre che delle tavole statistiche di normale, Student e chi quadro.
Lo scritto ha di norma una durata da un minimo di 1h30' a un massimo di 2h20' (in dipendenza dalla lunghezza dei quesiti). Nella parte 1 è valutata l'esattezza delle risposte, la chiarezza espositiva, la completezza delle stesse. Nella parte 2 è valuatata la correttezza del procedimento e l'esattezza delle risposte. Nella parte 3 è valutata la chiarezza e la completezza dell'esposizione.
La parte 1. e 2. contribuiscono ciascuna per i 2/5 del punteggio finale mentre la parte 3. ha un peso di 1/5.
L'orale è a richiesta del docente e/o dello studente ed è un colloquio sullo scritto, sugli argomenti svolti a lezione e sulla relazione. Nell'orale sono valutate le stesse qualità delle risposte che sono valutate nello scritto. Gli studenti con votazione insufficiente ma maggiore o uguale a 16/30 nello scritto possono richiedere di sostenere l'orale, così come tutti gli altri studenti con votazione sufficiente. In caso di sostenimento della prova orale, il peso dello scritto è di 3/4 e quello dell'orale di 1/4. Di norma i voti sufficienti (compreso il massimo dei voti) possono essere confermati senza prova orale, fermo restando la facoltà del docente di chiedere una prova orale in tutte le situazioni in cui ravvisi la necessità di chiarimenti riguardo alla prova scritta.
Orario di ricevimento
Su appuntamento
Sustainable Development Goals
Aims
To know and understand the basic tools of inferential statistics.
To be able to apply this knowledge, even using specific software, to situations where there is a sample of observations, in order to provide estimates of unknown parameters and well-founded opinions on the properties of these parameters, after an appropriate choice of the probabilistic model.
Contents
Statistical Models. Inferential Statistics: Estimators, Confidence Intervals, Hypothesis Testing. Use of Specific Software such as R or Spreadsheets.
Detailed program
Introduction to Statistics
Population, random sampling. Sampling problem. Statistics. Densities depending on unknown parameters.
Point Estimates of Parameters
Estimator, unbiased estimator, mean squared error, mean square consistency, necessary and sufficient condition for mean square consistency of a sequence of estimators. Estimators for the moments of a random variable: sample moments. Sample mean. Unbiased estimator of variance: sample variance. Method of moments for constructing estimators. Likelihood function. Maximum likelihood estimator. UMVUE estimator; lower bound of variance (Cramér-Rao inequality). Invariance properties of maximum likelihood estimators. Asymptotic properties of maximum likelihood estimators. Sampling from normal random variables: law of the sample mean. Law of the square of a normal(0,1): chi-square distribution with 1 degree of freedom. Law of the sum of squares of independent standard normals: chi-square distribution with k degrees of freedom. Law of the sample variance of a normal sample. Student's t-distribution.
Interval Estimates
Confidence intervals: definition, confidence level. Intervals for the mean of a normal population (known or unknown variance). Intervals for the variance of a normal population (known or unknown mean). Pivotal quantity and its use in calculating confidence intervals. Confidence intervals for large samples (particularly for frequencies, i.e., Bernoulli parameters). Pivotal quantity for samples from an absolutely continuous distribution.
Hypothesis Testing
Test for a statistical hypothesis; non-randomized test and critical region. Significance level, p-value. Uniformly most powerful test of a fixed level. Test for the mean of a normal population (known or unknown variance). Test for the variance of a normal population (known or unknown mean). Test for difference of means for normal populations. Comparison between intervals and tests. Test on one frequency and on two frequencies (large sample). Simple and generalized likelihood ratio test. Neyman-Pearson theorem. Pearson's chi-square test for goodness of fit (with or without estimated parameters). Pearson's chi-square test for independence.
Linear Regression
Simple and multiple linear regression: definition, interpretation, tests.
Prerequisites
Mathematical Analysis I and II, with a focus on integral calculus.
Basic Probability: laws of discrete and continuous random variables. Expected value and variance. Law of functions of random variables. Independence. Convergence of sequences of random variables.
Teaching form
A hybrid teaching approach is used, that combines lecture-based teaching (DE) and interactive teaching (DI). DE involves detailed presentation and explanation of theoretical content. DI includes active student participation through exercises and problems, short presentations, group discussions, and group or individual work. It is not possible to precisely determine in advance the number of hours dedicated to DE and DI, as these methods are dynamically intertwined to adapt to the course's needs and promote a participatory and integrated learning environment, combining theory and practice.
The lessons (48 hours, 6 ECTS) are conducted in person and are held in Italian. Upon request and by mutual agreement between the instructor and students, it will be possible to use the English language.
Depending on the availability of recording equipment, the lessons will be recorded and made available on the e-learning website.
Subject to the availability of computer labs, 20% of the course will include laboratory content through the use of statistical software
Textbook and teaching resource
Introduction to Statistics by A.M. Mood, F.A. Graybill, D.C. Boes, 1991, McGraw-Hill Italia, ISBN: 9788838606618
An Introduction to Mathematical Statistics: F. Bijma, M. Jonker, A. van der Vaart, Amsterdam University Press
Other materials: Lecture slides and exercise materials on elearning.unimib.it
Semester
Second semester
Assessment method
Written Exam Structure:
Open-ended questions: These questions cover theoretical concepts described in the course, including requests for definitions and/or statements and proofs of theorems.
Written exercises: These involve applying theoretical concepts and similar techniques to exercises proposed during lectures and for homework.
Presentation: This includes presenting a report on a problem to be analyzed at home.
For Part 1, students are not allowed to use teaching materials. For Part 2, students can use a self-produced formula sheet written on an A4 sheet (front and back), as well as statistical tables for normal, Student's t, and chi-square distributions.
The written exam typically lasts from a minimum of 1 hour and 30 minutes to a maximum of 2 hours and 20 minutes, depending on the length of the questions. Part 1 is evaluated based on the accuracy, clarity, and completeness of the answers. Part 2 is assessed based on the correctness of the procedure and the accuracy of the answers. Part 3 is evaluated based on the clarity and completeness of the presentation.
Parts 1 and 2 contribute equally to 2/5 of the final score each, while Part 3 has a weight of 1/5.
The oral exam is upon request of the teacher and/or the student and consists of a discussion about the written exam, topics covered in class, and the report. In the oral exam, the same qualities of responses evaluated in the written exam are considered. Students with an insufficient but passing grade of 16/30 or higher in the written exam can request to take the oral exam, as well as all other students with a passing grade. If the oral exam is taken, the weight of the written exam is 3/4 and that of the oral exam is 1/4. Generally, passing grades (including the maximum grade) can be confirmed without an oral exam, but the teacher may request an oral exam in all situations where clarification regarding the written exam is deemed necessary.
Office hours
By appointment