Syllabus del corso
Obiettivi formativi
L’attività formativa ha l’obiettivo di richiamare i concetti base dell’ inferenza statistica e alcuni strumenti di statistica descrittiva multivariata indispensabili per seguire con profitto i successivi insegnamenti dell’area statistica. Si rivolge a laureati la cui formazione triennale necessita di un livellamento rispetto a quella dei laureati triennali in Scienze Statistiche.
Alla fine del corso lo studente si è impadronito dei concetti chiave dell’inferenza statistica parametrica nell’ambito dei fenomeni univariati, sa interpretare e applicare le procedure inferenziali standard (stimatori puntuali e intervallari, test) sviluppate per alcuni specifici modelli parametrici di largo utilizzo ed è in grado, in buona misura, di costruire tali procedure per più generali modelli uni-parametrici. Inoltre ha compreso i concetti fondamentali e sa interpretare i risultati di alcuni metodi di statistica multivariata (in particolare analisi dei gruppi e delle componenti principali) che si propongono un’esplorazione dei dati al fine di pervenire ad una loro “riduzione” che ne evidenzi e preservi le caratteristiche principali.
Contenuti sintetici
- Richiami di calcolo delle probabilità
- Campione e inferenza statistica
- Stima puntuale
- Stima intervallare
- Verifica delle ipotesi
- Componenti principali
- Analisi dei cluster
Programma esteso
- Variabili casuali unidimensionali, principali
variabili discrete e continue
- Accenno alle variabili casuali bidimensionali
- Legge dei grandi numeri e teorema centrale del limite
- Il concetto di campione e i problemi dell’inferenza statistica
- La stima puntuale: proprietà degli stimatori, criteri di valutazione
- Metodi di stima
- La stima intervaIlare: metodi di costruzione, esempi notevoli
- Verifica delle ipotesi: test statistico, errore di prima e seconda specie, livello di significatività
- Esempi notevoli di test statistici
- Matrice dei dati e sue sintesi
- Rappresentazione dei dati, spazio degli individui, spazio delle variabili, distanze fra individui e distanze fra variabili.
- Cluster Analysis: principali procedure di raggruppamento, valutazione della qualità del raggruppamento, applicazioni.
- Componenti Principali: approccio fattoriale, estrazione delle componenti principali, regole di arresto, valutazione della variabilità riprodotta; applicazioni.
Prerequisiti
Nessuno
Metodi didattici
Il corso è erogato in italiano e prevede lezioni
frontali ed esercitazioni in aula.
Nel periodo di emergenza Covid-19 si prevede che le lezioni si svolgeranno da remoto asincrono con eventi in videoconferenza sincrona.
Le lezioni sono mirate allo comprensione delle conoscenze metodologiche relative agli argomenti trattati, dando particolare rilievo all’interpretazione intuitiva-concettuale delle nozioni impartite.
Le esercitazioni sono mirate ad applicare le conoscenze metodologiche acquisite tramite semplici esercizi ed analisi di dataset, con il fine di sviluppare capacità di affrontare problemi concreti e capacità critica rispetto alle tecniche considerate.
Modalità di verifica dell'apprendimento
L’esame finale consiste in una prova orale.
Tale prova è finalizzata a verificare la comprensione dei concetti sottostanti le procedure statistiche considerate e la capacità di utilizzarle appropriatamente al fine di affrontare problemi reali.
Testi di riferimento
- Cicchitelli, G. Probabilità e Statistica 2 edizione, Maggioli, 2004.
- Zani, S., Cerioli, A. Analisi dei dati e data mining per le decisioni aziendali. Giuffrè Editore, Milano 2007.
Periodo di erogazione dell’insegnamento
I semestre, I ciclo
Lingua di insegnamento
Italiano
Learning objectives
The aim of the course is to present basic concepts of statistical inference and some tools of multivariate statistics necessary to follow the subsequent statistical courses. It is addressed to students who do not possess a statistical background comparable to the one provided by a bachelor degree in Statistics.
Contents
- Elements of probability theory
- Sampling and statistical inference
- Point estimation
- Interval estimation
- Hypotheses testing
- Principal components
- Cluster analysis
Detailed program
- Random variables, main discrete and continuous univariate distributions
- Random vectors, some examples (Normal and multinomial)
- Law of large numbers and central limit theorem
- Sampling and statistical inference
- Point estimation: property of estimators, criteria of evaluation
- Estimation methods
- Interval estimation: methods of construction, important examples
- Hypotheses testing: test statistic, first and second kind error, p-value
- Some important tests
- Data matrix and its summaries
- Data representation, subject and variable spaces, distances among subjects and among variables.
- Cluster analysis: main clustering techniques, clustering evaluation, applications.
- Principal components: component extraction, stopping rules, measures of explained variability, applications.
Prerequisites
None
Teaching methods
Class lectures.
Assessment methods
Oral exam.
Textbooks and Reading Materials
- Cicchitelli, G. Probabilità e Statistica 2 edizione, Maggioli, 2004.
- Zani, S., Cerioli, A. Analisi dei dati e data mining per le decisioni aziendali. Giuffrè Editore, Milano 2007.
Semester
I semester, I term (six weeks)
Teaching language
Italian
Scheda del corso
Staff
-
Andrea Ongaro