- Statistical Methods
- Summary
Course Syllabus
Obiettivi
Conoscere e comprendere i concetti di base della probabilità e della statistica.
Saper applicare tali concetti a fenomeni e misurazione soggette ad aleatorietà, in particolare a insiemi di dati provenienti da situazioni reali.
In particolare
- comprendere quando un fenomeno può essere modellizzato come aleatorio
- imparare a stimare la probabilità di eventi
- imparare a scegliere fra diversi modelli aleatori quello più plausibile per il problema in oggetto
- comprendere il comportamento limite delle medie di quantità aleatorie indipendenti e aventi uguale distribuzione
- stimare parametri ignoti partendo dall'osservazione di un campione casuale
- discutere la plausibilità di ipotesi sui parametri della distribuzione dei dati raccolti e interpretare correttamente la risposta di un test d'ipotesi
- sapere discutere gli aspetti teorici e concreti dei concetti sopra citati, nonché applicarli a insiemi di dati raccolti personalmente o da terzi
Contenuti sintetici
Corso di base in metodi statistici:
- statistica descrittiva
- probabilità/modelli aleatori
- statistica inferenziale: stime puntuali, intervallari e test d'ipotesi
Programma esteso
Il programma è unico per frequentanti e non frequentanti.
Statistica Descrittiva
Vettori di dati, Media, varianza, deviazione standard. Istogrammi. Mediana, quartili, quantili, Boxplot. Covarianza e coefficiente di correlazione, diagramma di dispersione.
Probabilità
Probabilità di eventi; indipendenza di eventi. Variabili aleatorie discrete, densità, funzione di ripartizione, media e varianza di v.a. discreta. Esempi: uniforme discreta, binomiale, geometrica, Poisson. Variabili aleatorie continue, densità, funzione di distribuzione, media, varianza. Esempi: uniforme continua, esponenziale, gaussiana. Legge dei grandi numeri.
Teorema dei limite centrale (uso delle tavole della normale standard).
Statistica Inferenziale
Campioni, stimatori, stimatori non distorti. Stimatore della media. Stimatore non distorto della varianza. Intervalli di confidenza per la media (a varianza nota e ignota).
Test d'ipotesi. Errore di prima e di seconda specie. Livello di significatività. P-value.
Test su una media (monolatero e bilatero a varianza nota e ignota). Test su due medie. Test chi quadro di adattamento e di indipendenza.
Regressione
lineare.
Prerequisiti
Operazioni su insiemi; significato di funzione; analisi matematica (massimi e minimi di funzione, concetti di serie, integrazione di funzioni su R).
Modalità didattica
- Lezioni frontali in aula: 20 ore
- Lezioni online su elearning.unimib.it (modalità blended): 28 ore
Materiale didattico
Testi di riferimento:
- Calcolo delle probabilità e Statistica, di Marco Bramanti, Esculapio Editore.
- Esercizi di probabilità e statistica, di Bertacchi, Bramanti e Guerra, Esculapio Editore
Altro materiale sulla piattaforma elearning.unimib.it:
- Trasparenze delle lezioni
- Video di alcune lezioni
- Video di esercizi
- Quiz a risposta multipla
- Esercizi interattivi sulla piattaforma wims.matapp,unimib.it
Periodo di erogazione dell'insegnamento
Secondo semestre (marzo-giugno)
Modalità di verifica del profitto e valutazione
La valutazione si basa su un esame scritto (obbligatorio), del lavoro online (facoltativo) e una prova orale.
- L'esame scritto contiene domande a risposta multipla (del genere presente in piattaforma elearning), domande teoriche a risposta aperta (su definizioni o risultati teorici evidenziati nelle trasparenze delle lezioni) e esercizi (del tipo presente sulla piattaforma wims). L'orale è a richiesta del docente e/o dello studente (ogni qualvolta il docente o lo studente ne ravvedano la necessità, in particolare risulta obbligatorio per chi avesse un voto compreso fra i 16 e i 18/30 nello scritto, mentre chi avesse voto inferiore a 16 non può richiedere l'orale, risultando in ogni caso insufficiente).
- L'esame scritto può essere sostituito da due prove intermedie, una calendarizzata a metà corso (in genere in aprile) e l'altra a giugno. La prima prova verte sulla prima parte del programma, la seconda sulla seconda parte. E' ammesso alla seconda prova intermedia chi ha ottenuto un voto di almeno 14/30 nella prima prova intermedia. Il voto medio ottenuto nelle due prove si sostituisce dunque al voto dell'esame scritto.
- Negli esami scritti/orali (come nelle prove intermedie) è valutata la correttezza e completezza delle risposte. In domande ed esercizi sono valutate, fra l'altro, le capacità di scegliere modelli aleatori adeguati, conoscerne le proprietà caratteristiche, stimare le probabilità o i parametri, discutere tramite test le proprietà dei parametri del modello.
- Il lavoro online consiste nello svolgimento di quiz e esercizi online su piattaforma e-learning e wims e in un lavoro di gruppo (facoltativo) in cui si applicano le nozioni del corso ad un insieme di dati. Nel lavoro online è valutata (in modo automatico) la correttezza delle risposte date. Essendo le domande ed esercizi analoghi alle prove d'esame, sono in esse valutate le stesse competenze che sono valutate nell'esame (si veda il capoverso precedente). Il lavoro di gruppo è una analisi di dati scelti dagli studenti (i dati devono essere approvati dal docente, eventualmente il docente si riserva la possibilità di proporre un insieme di dati alternativo), e consegnata attraverso la piattaforma elearning per la correzione da parte del docente e del tutor, in cui si valuta la capacità di analisi critica e di applicazione dei concetti del corso ad un caso reale (in particolare la capacità di estrarre informazioni dai dati). Il lavoro online e del gruppo sono comunque facoltativi, nel caso lo studente non li svolga, il suo esame non potrà avere valutazione superiore ai 25/30. Senza un lavoro di gruppo con valutazione positiva il voto finale massimo è di 29/30.
Maggiori dettagli sul lavoro online si trovano nella presentazione del corso nella pagina elearning (accessibile dall'inizio del corso durante l'anno accademico).
Orario di ricevimento
Su appuntamento
Aims
Know and understand the basic concepts of probability and statistics.
Know and understand how to apply those concepts to random phenomena and measurements, in particular to real situations' data.
In particular
- understand when a phenomenon can be modeled as random
- learn to choose the most plausible model for your problem among different random models
- understand the limit behavior of averages of independent random quantities having equal distribution
- estimate unknown parameters starting from the observation of a random sample
- discuss the plausibility of hypotheses on the parameters of the distribution of the collected data and correctly interpret the answer of a hypothesis test
- know how to discuss the theoretical and concrete aspects of the concepts mentioned above, as well as apply them to data sets collected personally or by third parties
Contents
It is a first level course on the basic tools of descriptive and inferential statistics:
- descriptive statistics
- probability/random models
- inferential statistics: punctual and interval estimates, hypothesis testing
Detailed program
The program is the same for both attending and not attending students.
Descriptive Statistics
Data vectors, mean,variance, standard deviation. Histograms. Median, quartiles, quantiles, Boxplot. Covariance and correlation, scatterplot.
Probability
Probability of events; independence of events. Discrete random variables, density, distribution function, mean and variance of discrete random variables. Examples: discrete uniform, binomial, geometric, Poisson. Continuous random variables, density, distribution function, mean, variance. Examples: continuous uniform, exponential, Gaussian. Law of largenumbers. Central limit theorem (use of the tables of the standard normal).
Inferential Statistics
Samples, estimators, unbiased estimators. Estimator of the mean. Unbiased estimator of the variance.
Confidence intervals for the mean (with known or unknown variance).
Test of hypothesis. First and second type error. Level of a test, P-value.
Test on a mean (monolateral and two-sided with known or unknown variance). Test on two averages. Chi-squared test of adaptation and of independence.
Linear regression.
Prerequisites
Set
theory; real functions; calculus (minima and maxima of functions, series and integration of real functions).
Teaching form
- Lessons in the classroom: 20 hours
- Online lessons on elearning.unimib.it (blended learning): 28 hours
Textbook and teaching resource
Textbooks:
- Calcolo delle probabilità e Statistica, di Marco Bramanti, Esculapio Editore.
- Esercizi di probabilità e statistica, di Bertacchi, Bramanti e Guerra, Esculapio Editore
Other material on elearning.unimib.it:
- Lecture slides
- Video of some lessons
- Video of exercises
- Multiple answer quizzes
- Interactive exercises on the platform wims.matapp,unimib.it
Semester
Second semester (March-June)
Assessment method
The assessment is based on online work and a written exam.
- The written exam contains multiple choice questions (of the kind present in the e-learning platform), open-ended theoretical questions (on definitions or theoretical results highlighted in the transparency of the lessons) and exercises (of the type present on the wims platform). The oral exam is requested by the teacher and / or student (whenever the lecturer or student feel that it is needed, in particular it is mandatory for those who have a grade between 16 and 18/30 in the written exam, while those who got a vote less than 16 cannot request the oral examination, and are judged insufficient).
- The written exam can be replaced by two intermediate tests, one scheduled in mid-term (generally in April) and the other in June. The first test focuses on the first part of the program, the second on the second part. Those who have obtained a mark of at least 14/30 in the first intermediate test are admitted to the second intermediate test. The average grade obtained in the two tests therefore replaces the vote of the written exam.
- In the written / oral exams (as in the intermediate tests) the correctness and completeness of the answers is evaluated. In questions and exercises are evaluated, among other things, the ability to choose appropriate random models, know their characteristic properties, estimate the probabilities or parameters, discuss the properties of the model parameters by testing.
- The online work consists of quizzes and exercises on the e-learning and wims platform and in a group work (optional) in which the concepts of the course are applied to a set of data. In the online work the correctness of the answers given is evaluated (automatically). Since the questions and exercises are similar to the ones in the exams, they evaluate the same skills that are evaluated in the exam (see the previous paragraph). Group work is an analysis of a data set chosen by the students (the data set must be approved by the teacher, who eventually may propose a different data set), and delivered through the e-learning platform for correction by the teacher and tutor, which assesses the capacity for critical analysis and application of the concepts of the course to a real case (in particular the ability to extract information from data). The online and group work are optional, if the student does not do them, his/her exam will not be evaluated more than 25/30. Without a group work with a positive evaluation the maximum final grade is 28/30.
More details about the online work can be found in the presentation section of the e-learning course (accessible after the beginning of the course in the academic year).
Office hours
By appointment