Course Syllabus
Obiettivi formativi
Il corso si propone di introdurre i concetti e i metodi di statistica descrittiva, calcolo delle probabilità ed inferenza statistica (stima puntuale ed intervallare, test) sia dal punto di vista teorico che applicativo attraverso l’utilizzo di software (R).
Alla fine del corso lo studente ha la possibilità di capire l’induzione statistica e le implicazioni sulla popolazione derivanti dallo studio di un campione di dati, essendo in grado di sperimentare ed applicare le conoscenze acquisite su dataset reali.
Contenuti sintetici
Metodi di statistica descrittiva, calcolo delle probabilità ed inferenza statistica (stima puntuale e intervallare, test).
Programma esteso
- Introduzione al trattamento dati con R
- pacchetti R: base, dplyr, purrr, ggplot
- Analisi descrittiva: distribuzioni, rappresentazioni grafiche, indici di posizione e di variabilità, retta dei minimi quadrati
- Calcolo delle probabilità: concezioni probabilistiche, probabilità sugli eventi, teorema di Bayes, variabili aleatorie e distribuzioni di probabilità, distribuzioni notevoli, enunciazioni LLN e CLT
- Inferenza statistica: la logica del campionamento probabilistico. Stimatori e loro proprietà. Stima puntuale (Media varianza e proporzione). Cenni sugli stimatori di massima verosimiglianza.
- Stima intervallare: concetto di confidenza, intervalli di confidenza, casi particolari sulla media e la varianza
- Verifica di ipotesi: Il concetto di statistica test. La significatività e la potenza del test. Test sulla media, varianza, proporzione, sulla differenza tra medie, test di indipendenza.
Prerequisiti
Nessuno.
Metodi didattici
Lezioni frontali con e senza l'ausilio del computer (modalità erogativa in presenza).
Ore di didattica erogativa (DE): 42
Ore di didattica interattiva (DI): 0
Sulla pagina e-learning verrà fornito il materiale necessario per la preparazione dell'esame anche per eventuali studenti non frequentanti.
Modalità di verifica dell'apprendimento
PROVA SCRITTA: consiste in una batteria di domande a risposta multipla ed esercizi numerici volti a verificare la conoscenza della TEORIA affrontata a lezione e la capacità di utilizzare il linguaggio R per condurre analisi statistiche (punteggio massimo 31).
Non sono previste prove in itinere
Criteri di valutazione:
insufficiente: minore di 18; sufficiente: 18-23; buono: 24-27; ottimo: 28-30; eccellente: 30 e lode
Testi di riferimento
Materiale del docente a disposizione degli studenti sull'e-learning
Sulla pagina elearning verrà fornito il materiale necessario per la preparazione dell'esame anche da parte dei non frequentanti
Libro di testo:
Alan Agresti, Maria Kateri (2022), Foundations of Statistics for Data Scientists With R and Python, Chapman & Hall
Altri testi a scelta:
- A.M. Mood, F.A. Graybill, D.C. Boes, Introduzione alla statistica
- G. Cicchitelli, P. D'Urso M. Minozzo, Statistica: principi e metodi
- P.S. Mann, Introductory Statistics
- M. Lavine, Introduction to Statistical Thought
Periodo di erogazione dell'insegnamento
Primo semestre (Settembre - Novembre)
Lingua di insegnamento
Inglese
Sustainable Development Goals
Learning objectives
The course aims to introduce the concepts and methods of descriptive statistics, probability and statistical inference (point and interval estimation, tests) both from a theoretical and an application point of view through the use of software (R).
At the end of the course the student has the opportunity to understand the statistical induction and the implications on the population deriving from the study of a data sample, being able to experiment and apply the knowledge acquired on real datasets.
Contents
Descriptive statistics, probability and statistical inference (point and interval estimation, tests)
Detailed program
- Introduction to data analysis with R
- R packages: base, dplyr, purrr, ggplot
- Descriptive analysis: distributions, graphical representations, position and variability indices, minimum squares line
- Probability: probabilistic conceptions, probability on events, Bayes theorem, random variables and probability distributions, large distributions, LLN and CLT statements
- Statistical inference: the logic of probabilistic sampling. Estimators and their properties. Point estimate (Average, variance and proportion). Notes on maximum likelihood estimators.
- Interval estimation: concept of confidence, confidence intervals, particular cases on the mean and variance
- Hypothesis testing: The concept of test statistics. The significance and power of the test. Test on average, variance, proportion, on the difference between averages, independence test.
Prerequisites
None.
Teaching methods
Lectures with and without computer (in presence).
Traditional teaching hours: 42
Interactive teaching hours: 0
On the e-learning page, the material for the exam preparation will be provided, considering also possible non-attending students.
Assessment methods
WRITTEN EXAM: it is a multiple choice and numeric exercises exam with the aim to verify knowledge of the theoretical issues proposed in class and the ability ot use the R language to conduct statistical analysis (max grade 31).
There is no mid term evaluation
Grading policy:
insufficient: less than18; sufficient: 18-23; good: 24-27; very good: 28-30; excellent: 30 cum laude
Textbooks and Reading Materials
Teacher material available for the students on e-learning site
On the elearning website attending and not attending students will find the necessary material to prepare themselves for the exam
Textbook:
Alan Agresti, Maria Kateri (2022), Foundations of Statistics for Data Scientists With R and Python, Chapman & Hall
Other texts of your choice:
- A.M. Mood, F.A. Graybill, D.C. Boes, Introduzione alla statistica
- G. Cicchitelli, P. D'Urso M. Minozzo, Statistica: principi e metodi
- P.S. Mann, Introductory Statistics
- M. Lavine, Introduction to Statistical Thought
Semester
I semester (September-November)
Teaching language
English