- Area di Scienze
- Corso di Laurea Triennale
- Scienze e Tecnologie per l'Ambiente [E3201Q]
- Insegnamenti
- A.A. 2023-2024
- 3° anno
- Statistica (blended)
- Introduzione
Syllabus del corso
Obiettivi
Conoscere e comprendere i concetti di base della probabilità e della statistica.
Saper applicare tali concetti a fenomeni e misurazione soggette ad aleatorietà, in particolare a insiemi di dati provenienti da situazioni reali.
In particolare
- comprendere quando un fenomeno può essere modellizzato come aleatorio
- imparare a stimare la probabilità di eventi
- imparare a scegliere fra diversi modelli aleatori quello più plausibile per il problema in oggetto
- comprendere il comportamento limite delle medie di quantità aleatorie indipendenti e aventi uguale distribuzione
- stimare parametri ignoti partendo dall'osservazione di un campione casuale
- discutere la plausibilità di ipotesi sui parametri della distribuzione dei dati raccolti e interpretare correttamente la risposta di un test d'ipotesi
- sapere discutere gli aspetti teorici e concreti dei concetti sopra citati, nonché applicarli a insiemi di dati raccolti personalmente o da terzi
Contenuti sintetici
Corso di base in metodi statistici:
- statistica descrittiva
- probabilità/modelli aleatori
- statistica inferenziale: stime puntuali, intervallari e test d'ipotesi
Programma esteso
Il programma è unico per frequentanti e non frequentanti.
Statistica Descrittiva
Vettori di dati, Media, varianza, deviazione standard. Istogrammi. Mediana, quartili, quantili, Boxplot. Covarianza e coefficiente di correlazione, diagramma di dispersione.
Probabilità
Probabilità di eventi; indipendenza di eventi. Variabili aleatorie discrete, densità, funzione di ripartizione, media e varianza di v.a. discreta. Esempi: uniforme discreta, binomiale, geometrica, Poisson. Variabili aleatorie continue, densità, funzione di distribuzione, media, varianza. Esempi: uniforme continua, esponenziale, gaussiana. Legge dei grandi numeri.
Teorema dei limite centrale (uso delle tavole della normale standard).
Statistica Inferenziale
Campioni, stimatori, stimatori non distorti. Stimatore della media. Stimatore non distorto della varianza. Intervalli di confidenza per la media (a varianza nota e ignota).
Test d'ipotesi. Errore di prima e di seconda specie. Livello di significatività. P-value.
Test su una media (monolatero e bilatero a varianza nota e ignota). Test su due medie. Test chi quadro di adattamento e di indipendenza.
Regressione lineare.
Prerequisiti
Operazioni su insiemi; significato di funzione; analisi matematica (massimi e minimi di funzione, concetti di serie, integrazione di funzioni su R).
Modalità didattica
- Lezioni frontali in aula: 20 ore
- Lezioni online su elearning.unimib.it (modalità blended): 28 ore
Materiale didattico
Testi di riferimento:
- Calcolo delle probabilità e Statistica, di Marco Bramanti, Esculapio Editore.
- Esercizi di probabilità e statistica, di Bertacchi, Bramanti e Guerra, Esculapio Editore
Altro materiale sulla piattaforma elearning.unimib.it:
- Trasparenze delle lezioni
- Video di alcune lezioni
- Video di esercizi
- Quiz a risposta multipla
- Esercizi interattivi sulla piattaforma wims.matapp,unimib.it
Periodo di erogazione dell'insegnamento
Secondo semestre (marzo-giugno)
Modalità di verifica del profitto e valutazione
La valutazione si basa su un esame scritto (obbligatorio), del lavoro online (facoltativo) e una prova orale.
- L'esame scritto contiene domande a risposta multipla (del genere presente in piattaforma elearning), domande teoriche a risposta aperta (su definizioni o risultati teorici evidenziati nelle trasparenze delle lezioni) e esercizi (del tipo presente sulla piattaforma wims).
- Quando sia tecnicamente possibile, l'esame è parzialmente informatizzato e consiste di:
- domande aperte (definizioni/proprietà/risultati teorici) in genere su carta, più domande a risposta multipla (su piattaforma informatica) sempre sugli aspetti più teorici, per un peso totale di 1/3 del voto dello scritto. Per questa parte non è consentito consultare materiale didattico né altri strumenti.
- esercizi (su piattaforma informatica) di applicazione di quanto visto nel corso, con possibili domande a risposta aperta in cui mostrare esempi concreti di applicazione, per un peso totale di 2/3 del voto dello scritto. Per questa parte è consentito l'uso di un formulario autoprodotto su foglio A4 (fronte e retro) e di una calcolatrice scientifica non programmabile.
-
L'orale è a richiesta del docente e/o dello studente (ogni qualvolta il docente o lo studente ne ravvedano la necessità, in particolare risulta obbligatorio per chi avesse un voto compreso fra i 16 e i 18/30 nello scritto, mentre chi avesse voto inferiore a 16 non può richiedere l'orale, risultando in ogni caso insufficiente). Qualora venga sostenuto l'orale, il suo punteggio fa media con il voto dello scritto.
-
L'esame scritto può essere sostituito da due prove intermedie, una calendarizzata a metà corso (in genere in aprile) e l'altra a giugno. La prima prova verte sulla prima parte del programma, la seconda sulla seconda parte. E' ammesso alla seconda prova intermedia chi ha ottenuto un voto di almeno 14/30 nella prima prova intermedia. Il voto medio ottenuto nelle due prove si sostituisce dunque al voto dell'esame scritto.
-
Negli esami scritti/orali (come nelle prove intermedie) è valutata la correttezza e completezza delle risposte. In domande ed esercizi sono valutate, fra l'altro, le capacità di scegliere modelli aleatori adeguati, conoscerne le proprietà caratteristiche, stimare le probabilità o i parametri, discutere tramite test le proprietà dei parametri del modello.
-
Il lavoro online consiste nello svolgimento di quiz e esercizi online su piattaforma e-learning e wims e in un lavoro di gruppo (facoltativo) in cui si applicano le nozioni del corso ad un insieme di dati. Nel lavoro online è valutata (in modo automatico) la correttezza delle risposte date. Essendo le domande ed esercizi analoghi alle prove d'esame, sono in esse valutate le stesse competenze che sono valutate nell'esame (si veda il capoverso precedente). Il lavoro di gruppo è una analisi di dati scelti dagli studenti (i dati devono essere approvati dal docente, eventualmente il docente si riserva la possibilità di proporre un insieme di dati alternativo; il docente fornisce alcuni set di dati tra cui gli studenti possono scegliere), e consegnata attraverso la piattaforma elearning per la correzione da parte del docente, in cui si valuta la capacità di analisi critica e di applicazione dei concetti del corso ad un caso reale (in particolare la capacità di estrarre informazioni dai dati), nonché la capacità espositiva. Il lavoro online e del gruppo forniscono complessivamente un punteggio da 0 a 7 punti (1.5 punti se tutti i quiz sono svolti almeno una volta con voto almeno 24; 2.5 punti se tutti gli esercizi wims sono svolti almeno una volta con voto almeno 24; da 0 a 3 la valutazione del lavoro di gruppo).Maggiori dettagli sul lavoro online si trovano nella presentazione del corso nella pagina elearning (accessibile dall'inizio del corso durante l'anno accademico).
Il voto finale è composto dal voto dello scritto (+ eventuale orale) in 25esimi (moltiplicare il voto per 25/30) a cui si somma il punteggio del lavoro online.
Orario di ricevimento
Su appuntamento
Sustainable Development Goals
Aims
Know and understand the basic concepts of probability and statistics.
Know and understand how to apply those concepts to random phenomena and measurements, in particular to real situations' data.
In particular
- understand when a phenomenon can be modeled as random
- learn to choose the most plausible model for your problem among different random models
- understand the limit behavior of averages of independent random quantities having equal distribution
- estimate unknown parameters starting from the observation of a random sample
- discuss the plausibility of hypotheses on the parameters of the distribution of the collected data and correctly interpret the answer of a hypothesis test
- know how to discuss the theoretical and concrete aspects of the concepts mentioned above, as well as apply them to data sets collected personally or by third parties
Contents
It is a first level course on the basic tools of descriptive and inferential statistics:
- descriptive statistics
- probability/random models
- inferential statistics: punctual and interval estimates, hypothesis testing
Detailed program
The program is the same for both attending and not attending students.
Descriptive Statistics
Data vectors, mean,variance, standard deviation. Histograms. Median, quartiles, quantiles, Boxplot. Covariance and correlation, scatterplot.
Probability
Probability of events; independence of events. Discrete random variables, density, distribution function, mean and variance of discrete random variables. Examples: discrete uniform, binomial, geometric, Poisson. Continuous random variables, density, distribution function, mean, variance. Examples: continuous uniform, exponential, Gaussian. Law of largenumbers. Central limit theorem (use of the tables of the standard normal).
Inferential Statistics
Samples, estimators, unbiased estimators. Estimator of the mean. Unbiased estimator of the variance.
Confidence intervals for the mean (with known or unknown variance).
Test of hypothesis. First and second type error. Level of a test, P-value.
Test on a mean (monolateral and two-sided with known or unknown variance). Test on two averages. Chi-squared test of adaptation and of independence.
Linear regression.
Prerequisites
Set theory; real functions; calculus (minima and maxima of functions, series and integration of real functions).
Teaching form
- Lessons in the classroom: 20 hours
- Online lessons on elearning.unimib.it (blended learning): 28 hours
Textbook and teaching resource
Textbooks:
- Calcolo delle probabilità e Statistica, di Marco Bramanti, Esculapio Editore.
- Esercizi di probabilità e statistica, di Bertacchi, Bramanti e Guerra, Esculapio Editore
Other material on elearning.unimib.it:
- Lecture slides
- Video of some lessons
- Video of exercises
- Multiple answer quizzes
- Interactive exercises on the platform wims.matapp,unimib.it
Semester
Second semester (March-June)
Assessment method
The assessment is based on online work and a written exam.
- The written exam contains multiple choice questions (of the kind present in the e-learning platform), open-ended theoretical questions (on definitions or theoretical results highlighted in the transparency of the lessons) and exercises (of the type present on the wims platform).
- When it is technically possible, the exam is partially computerized and consists of:
- open questions (definitions/properties/theoretical results) generally on paper, plus multiple-choice questions (on a computer-based platform) always on the more theoretical aspects, for a total weight of 1/3 of the grade of the written exam. For this part it is not allowed to consult teaching materials or other tools.
- exercises (on a computer platform) on the application of what has been seen in the course, with possible open questions in which to show concrete examples of application, for a total weight of 2/3 of the grade of the written exam. For this part, the use of a self-made form on A4 sheet (front and back) and a non-programmable scientific calculator is permitted.
- The oral exam is requested by the teacher and / or student (whenever the lecturer or student feel that it is needed, in particular it is mandatory for those who have a grade between 16 and 18/30 in the written exam, while those who got a vote less than 16 cannot request the oral examination, and are judged insufficient). If the oral exam is taken, its score is averaged with the one of the written exam.
- The written exam can be replaced by two intermediate tests, one scheduled in mid-term (generally in April) and the other in June. The first test focuses on the first part of the program, the second on the second part. Those who have obtained a mark of at least 14/30 in the first intermediate test are admitted to the second intermediate test. The average grade obtained in the two tests therefore replaces the vote of the written exam.
- In the written / oral exams (as in the intermediate tests) the correctness and completeness of the answers is evaluated. In questions and exercises are evaluated, among other things, the ability to choose appropriate random models, know their characteristic properties, estimate the probabilities or parameters, discuss the properties of the model parameters by testing.
- The online work consists of quizzes and exercises on the e-learning and wims platform and in a group work (optional) in which the concepts of the course are applied to a set of data. In the online work the correctness of the answers given is evaluated (automatically). Since the questions and exercises are similar to the ones in the exams, they evaluate the same skills that are evaluated in the exam (see the previous paragraph). Group work is an analysis of a data set chosen by the students (the data set must be approved by the teacher, who eventually may propose a different data set; the teacher provides examples of data sets among which the students may choose), and delivered through the e-learning platform for correction by the teacher and tutor, which assesses the capacity for critical analysis and application of the concepts of the course to a real case (in particular the ability to extract information from data). The online and group work give a total score from 0 to 7 points (1.5 points if all the quizzes are done at least once with a score of at least 24; 2.5 points if all the wims exercises are done at least once with a score of at least 24; from 0 to 3 the evaluation of the group work). More details on the online work can be found in the presentation of the course on the elearning page (accessible from the beginning of the course during the academic year).
The final grade is made up of the written grade (+ possibly oral) out of 25 points (multiply the grade by 25/30) to which is added the score of the online work.
Office hours
By appointment