Course Syllabus
Obiettivi formativi
L’attività formativa ha l’obiettivo di richiamare i concetti base dell’ inferenza statistica e alcuni strumenti di statistica descrittiva multivariata indispensabili per seguire con profitto i successivi insegnamenti dell’area statistica. Si rivolge a laureati la cui formazione triennale necessita di un livellamento rispetto a quella dei laureati triennali in Scienze Statistiche.
Alla fine del corso lo studente si è impadronito dei concetti chiave dell’inferenza statistica parametrica nell’ambito dei fenomeni univariati, sa interpretare e applicare le procedure inferenziali standard (stimatori puntuali e intervallari, test) sviluppate per alcuni specifici modelli parametrici di largo utilizzo ed è in grado, in buona misura, di costruire tali procedure per più generali modelli uni-parametrici. Inoltre ha compreso i concetti fondamentali e sa interpretare i risultati di alcuni metodi di statistica multivariata (in particolare analisi dei gruppi e delle componenti principali) che si propongono un’esplorazione dei dati al fine di pervenire ad una loro “riduzione” che ne evidenzi e preservi le caratteristiche principali.
Contenuti sintetici
- Richiami di calcolo delle probabilità
- Campione e inferenza statistica
- Stima puntuale
- Stima intervallare
- Verifica delle ipotesi
- Componenti principali
- Analisi dei cluster
Programma esteso
- Variabili casuali unidimensionali, principali
variabili discrete e continue
- Accenno alle variabili casuali bidimensionali
- Legge dei grandi numeri e teorema centrale del limite
- Il concetto di campione e i problemi dell’inferenza statistica
- La stima puntuale: proprietà degli stimatori, criteri di valutazione
- Metodi di stima
- La stima intervaIlare: metodi di costruzione, esempi notevoli
- Verifica delle ipotesi: test statistico, errore di prima e seconda specie, livello di significatività
- Esempi notevoli di test statistici
- Matrice dei dati e sue sintesi
- Rappresentazione dei dati, spazio degli individui, spazio delle variabili, distanze fra individui e distanze fra variabili.
- Cluster Analysis: principali procedure di raggruppamento, valutazione della qualità del raggruppamento, applicazioni.
- Componenti Principali: approccio fattoriale, estrazione delle componenti principali, regole di arresto, valutazione della variabilità riprodotta; applicazioni.
Prerequisiti
Nozioni elementari di matematica.
Metodi didattici
Il corso è erogato in italiano e prevede lezioni
frontali ed esercitazioni in aula.
Le lezioni sono mirate allo comprensione delle conoscenze metodologiche relative agli argomenti trattati, dando particolare rilievo all’interpretazione intuitiva-concettuale delle nozioni impartite.
Le esercitazioni sono mirate ad applicare le conoscenze metodologiche acquisite tramite semplici esercizi ed analisi di dataset, con il fine di sviluppare capacità di affrontare problemi concreti e capacità critica rispetto alle tecniche considerate.
Modalità di verifica dell'apprendimento
L’esame finale consiste in un colloquio sugli argomenti svolti a lezione.
Tale prova è finalizzata a verificare la comprensione dei concetti sottostanti le procedure statistiche considerate e la capacità di utilizzarle appropriatamente al fine di affrontare problemi reali.
Testi di riferimento
- Cicchitelli, G. Probabilità e Statistica 2 edizione, Maggioli, 2004.
- Zani, S., Cerioli, A. Analisi dei dati e data mining per le decisioni aziendali. Giuffrè Editore, Milano 2007.
Periodo di erogazione dell’insegnamento
I semestre, I ciclo
Lingua di insegnamento
Italiano
Learning objectives
The aim of the course is to present basic concepts of statistical inference and some tools of multivariate statistics necessary to follow the subsequent statistical courses. It is addressed to students who do not possess a statistical background comparable to the one provided by a bachelor degree in Statistics.
At the end of the course the student should master the key concepts of parametric inferential statistics in a one dimesional framework. Moreover she/he should interpret and apply standard inferential procedures (point and interval estimators, tests) developed for some common parametric models and should be able, to a large extent, to build such procedures for more general uni-parametric models. Furthermore the student is expected to understand fundamental concepts and interpret results of some methods of multivariate statistics (in particular cluster analisys and principal components).
Contents
- Elements of probability theory
- Sampling and statistical inference
- Point estimation
- Interval estimation
- Hypotheses testing
- Principal components
- Cluster analysis
Detailed program
- Random variables, main discrete and continuous univariate distributions
- Random vectors, some examples (Normal and multinomial)
- Law of large numbers and central limit theorem
- Sampling and statistical inference
- Point estimation: property of estimators, criteria of evaluation
- Estimation methods
- Interval estimation: methods of construction, important examples
- Hypotheses testing: test statistic, first and second kind error, p-value
- Some important tests
- Data matrix and its summaries
- Data representation, subject and variable spaces, distances among subjects and among variables.
- Cluster analysis: main clustering techniques, clustering evaluation, applications.
- Principal components: component extraction, stopping rules, measures of explained variability, applications.
Prerequisites
Elementary notions of mathematics.
Teaching methods
Class lectures taught in Italian.
Lectures are aimed at understanding methodological issues through simple exercises and dataset analysis, with the objective of devoloping capacity of dealing with real problems and critical ability with respect to the considered methods.
Assessment methods
Oral exam on the subjects taught during the course.
Such exam is aimed at verifying the understanding of the concepts underlying the considered statistical procedures and the capacity of employing them to face real problems.
Textbooks and Reading Materials
- Cicchitelli, G. Probabilità e Statistica 2 edizione, Maggioli, 2004.
- Zani, S., Cerioli, A. Analisi dei dati e data mining per le decisioni aziendali. Giuffrè Editore, Milano 2007.
Semester
I semester, I term (six weeks)
Teaching language
Italian
Key information
Staff
-
Andrea Ongaro