Course Syllabus
Obiettivi formativi
Il corso si propone di introdurre i concetti e i metodi di statistica descrittiva, calcolo delle probabilità ed inferenza statistica (stima, test, modelli) sia dal punto di vista teorico che applicativo attraverso l’utilizzo di software (R), con particolare attenzione agli argomenti rilevanti per i corsi più avanzati di datamining e machine learning.
Alla fine del corso lo studente ha la possibilità di capire l’induzione statistica e le implicazioni sulla popolazione derivanti dallo studio di un campione di dati, essendo in grado di sperimentare ed applicare le conoscenze acquisite su dataset reali.
Contenuti sintetici
Metodi di statistica descrittiva, calcolo delle probabilità ed inferenza statistica
(stima, test, modelli)
Programma esteso
- Introduzione al trattamento dati con R
- Analisi descrittiva: distribuzioni, rappresentazioni grafiche, indici di posizione e di variabilità
- Calcolo delle probabilità: concezioni probabilistiche, probabilità sugli eventi, teorema di Bayes, variabili aleatorie e distribuzioni di probabilità, distribuzioni notevoli, enunciazioni LLN e CLT
- Inferenza statistica: la logica del campionamento probabilistico. Stimatori e loro proprietà. Stima puntuale (Media varianza e proporzione). Cenni sugli stimatori di massima verosimiglianza.
- Stima intervallare: concetto di confidenza, intervalli di confidenza, casi particolari sulla media e la varianza
- Verifica di ipotesi: Il concetto di statistica test. La significatività e la potenza del test. Test sulla media, varianza, proporzione, sulla differenza tra medie, test di indipendenza.
- Regressione lineare semplice: metodo di stima dei minimi quadrati, misure di adeguatezza del modello, distribuzione campionaria degli stimatori OLS, test d'ipotesi e intervalli di confidenza per i coefficienti di regressione, analisi della varianza, outliers e osservazioni influenti
Prerequisiti
Nessuno
Metodi didattici
Lezione frontale e sessioni di laboratorio
Modalità di verifica dell'apprendimento
PROVA SCRITTA: consiste in una batteria di domande a risposta multipla sulla TEORIA affrontata a lezione
PROJECT WORK: Sviluppo di un progetto originale a partire da una semplice idea o dall’analisi di un caso esistente. Lavoro applicativo da svolgere autonomamente o in gruppo (al max 3 studenti) su un dataset scelto dallo studente (con R) su cui applicare i principali argomenti svolti a lezione (analisi descrittive, test, modello lineare). Il progetto va inviato al docente almeno 10 gg prima della prova, sarà valido per l'intero anno accademico.
Non sono previste prove in itinere
Testi di riferimento
Materiale del docente a disposizione degli studenti sull'e-learning
Testo a scelta:
- A.M. Mood, F.A. Graybill, D.C. Boes, Introduzione alla statistica
- G. Cicchitelli, P. D'Urso M. Minozzo, Statistica: principi e metodi
- P.S. Mann, Introductory Statistics
- M. Lavine, Introduction to Statistical Thought
Periodo di erogazione dell’insegnamento
I semestre Settembre-Novembre
Lingua di insegnamento
Italiano
Learning objectives
The course aims to introduce the concepts and methods of descriptive statistics, probability and statistical inference (estimation, tests, models) both from a theoretical and an application point of view through the use of software (R), with particular attention to the topics relevant for the most advanced datamining and machine learning courses.
At the end of the course the student has the opportunity to understand the statistical induction and the implications on the population deriving from the study of a data sample, being able to experiment and apply the knowledge acquired on real datasets.
Contents
Descriptive statistics, probability and statistical inference
(estimation, tests, models)
Detailed program
- Introduction to data analysis with R
- Descriptive analysis: distributions, graphical representations, position and variability indices
- Probability: probabilistic conceptions, probability on events, Bayes theorem, random variables and probability distributions, large distributions, LLN and CLT statements
- Statistical inference: the logic of probabilistic sampling. Estimators and their properties. Point estimate (Average, variance and proportion). Notes on maximum likelihood estimators.
- Interval estimation: concept of confidence, confidence intervals, particular cases on the mean and variance
- Hypothesis testing: The concept of test statistics. The significance and power of the test. Test on average, variance, proportion, on the difference between averages, independence test.
- Simple linear regression: least squares estimation method, model adequacy measures, sampling distribution of OLS estimators, hypothesis tests and confidence intervals for the regression coefficients, analysis of variance, outliers and influential observations
Prerequisites
None
Teaching methods
Class lessons and computer lab
Assessment methods
WRITTEN EXAM: it is a multple choise exam about the theoretical issues proposed in class
PROJECT WORK: (also in group) involving a data analysis (with R) on a dataset chosen by the
student to replicate arguments and analyses discussed during lab sessions. The project must be sendat leats 10 days before the final test (written exam) to the teacher
There is no mid term evaluation
Textbooks and Reading Materials
Text of your choice:
- A.M. Mood, F.A. Graybill, D.C. Boes, Introduzione alla statistica
- G. Cicchitelli, P. D'Urso M. Minozzo, Statistica: principi e metodi
- P.S. Mann, Introductory Statistics
- M. Lavine, Introduction to Statistical Thought
Semester
I semester (September-November)
Teaching language
Italian
Key information
- Field of research
- SECS-S/01
- CFU
- 6
- Term
- Primo Semestre
- Activity type
- Obbligatorio a scelta
- Course Length (Hours)
- 46
- Degree Course Type
- Corso di Laurea Magistrale