- Area Economico-Statistica
- Corso di Laurea Triennale
- Statistica e Gestione delle Informazioni [E4102B]
- Insegnamenti
- A.A. 2019-2020
- 2° anno
- Analisi dei Dati
- Introduzione
Syllabus del corso
Obiettivi formativi
Il corso permette di conoscere sotto il profilo teorico le principali tecniche di analisi dei dati esplorative sia a partire da dati quantitativi che qualitativi. Inoltre mette in grado di analizzare dati empirici mediante tali tecniche.
Conoscenza e comprensione. Mediante una indagine esplorativa su dati multivariati di elevata dimensione si fornisce conoscena e comprensione a riguardo delle
relazioni fra variabili in un contesto multivariato secondo diverse ottiche quali la relazione fra insiemi di variabili quantitativi e qualitativi, le variabili che permettono di discrimniare fra gruppi di individui, la rappresentazioni di distanze fra individui in dimensioni ridotte.
Capacità di applicare conoscenza e comprensione. Attraverso le analisi dei dati esplorative più opportune nei diversi casi, si individuano, a partire da insiemi di variabili molto numerose , le variabili più rilevanti per costruire modelli lineari o non lineari di tipo multivariato, modelli logistici, modelli di analisi della varianza, rappresentazioni di individui in spazi di non elevate dimensioni.
Contenuti sintetici
Analisi della correlazione canonica
Analisi discriminante
Analisi delle corrispondenze
Multidimensional scaling
Programma esteso
Introduzione analisi dei dati
A Analisi della correlazione canonica
1 Scopo
2 Modo per ricavare 1° variabile canonica e successive
3 Lettura risultati
4 Esempi
5 Esercitazioni con SAS
B Analisi discriminante
1 Scopo
2 I dati
3 Modo per ricavare 1° variabili discriminante e successive
4 Lettura risultati
5 Modo alternativo per ricavare variabili discriminanti
6 Esempi
7 Esercitazioni con SAS
C Analisi corrispondenze
1 Scopo
2 Matrici profili riga e colonna
3 Analisi corrispondenze in ottica correlazione canonica e componenti principali
4 Lettura risultati: scomposizione χ2
5 Lettura altri risultati
6 Analisi delle corrispondenze multiple
7 Esempi
8 Esercitazioni con SAS
D Multidimensional scaling
1 Multidimensional scaling metrico con distanze euclidee
2 Teorema di Torgerson
3 Lettura risultati
4 Esempi
5 Esercitazioni con SAS
6 Multidimensional scaling con dissimilarità metriche
7 Multidimensional scaling con dissimilarità ordinali
8 Esempi
9 Esercitazioni con SAS
Prerequisiti
Questa
attività formativa deve essere preceduta dal superamento dell’esame di Analisi Statistica Multivariata.
Metodi didattici
Il corso verrà erogato sia mediante lezioni frontali sia mediante esercitazioni pratiche in laboratorio informatico con il linguaggio SAS. Durante le lezioni verranno fornite le conoscenze teoriche dei metodi statistici oggetto del corso, mentre nelle esercitazioni si applicheranno queste tecniche ad alcuni casi reali.
Modalità di verifica dell'apprendimento
L’esame è in forma scritta con orale facoltativo. La verifica scritta si compone di due domande di teoria sui metodi oggetto del corso e da una prova pratica in laboratorio, da svolgersi durante l'esame scritto con il software SAS, in analogia a quanto svolto durante le esercitazioni.
Le domande teoriche consentono di verificare la
conoscenza degli scopi, dei metodi di risoluzione, del commento dei risultati dei metodi di analisi esplorativa dei dati. Si richiede la capacità
di esprimersi con un adeguato linguaggio tecnico. La prova pratica vuole verificare la capacità di analizzare un data set di dati reali mediante gli strumenti di analisi dei dati più opportuni nei diversi casi commentando e interpretando adeguatamente i risultati.
Non sono previsti esami distinti per studenti frequentanti e studenti non frequentanti.
Non sono previste prove in itinere.
Testi di riferimento
Dispense e lucidi del docente.
Vitali O., Statistica per le scienze applicate. Vol. 2, Cacucci Editore, 1993 (per correlazione canonica e analisi discriminante).
Zani S., Cerioli A. Analisi dei dati e data mining per le decisioni aziendali. Giuffré, 2007 (per analisi delle corrispondenze e multidimensional scaling).
Periodo di erogazione dell’insegnamento
2° semestre 2° ciclo
Lingua di insegnamento
Italiano
Learning objectives
The course allows to know the main techniques of data analysis both from quantitative and qualitative data, under the theorical point of view .
Furthermore it enables to utilize these techniques in order to analyze empirical data. Knowledge and understanding. Through an exploratory survey on multivariate data of high dimension, knowledge and understanding is provided
in regards to the relationships between variables in a multivariate context.
This goal is reached according to different optics such as the relationship between sets of quantitative and qualitative variables,
the variables that allow to discriminate between groups of individuals, the representation of distances between individuals in reduced dimensions. Ability to apply knowledge and understanding. By analyzing the most appropriate exploratory data in the various cases,
the student is able to choose the most relevant variables for constructing multivariate linear or non-linear models, logistic models,
variance analysis models, representations of individuals in spaces of not large dimensions.
Contents
Canonical Correlation Analysis
Discriminant Analysis
Correspondence Analysis
Multidimensional Scaling
Detailed program
Introduction to data analysis
A Canonical Correlation Analysis
1 Purpose
2 How to derive the 1° canonical variable and subsequent canonical variates
3 Interpretation of the results
4 Examples
5 Examples in SAS
B Discriminant Analysis
1 Purpose
2 Data
3 How to derive the 1° discriminant variable and subsequent discriminant variables
4 Interpretation of the results
5 Alternative way to derive discriminating variables
6 Examples
7 Examples in SAS
C Correspondence Analysis
1 Purpose
2 Row and column profiles
3 Correspondence Analysis as a special case of Canonical Correlation and Principal Component Analysis
4 Interpretation of the results: χ2 decomposition
5 Interpretation of other results
6 Multiple Correspondence Analysis
7 Examples
8 Examples in SAS
D Multidimensional scaling
1 Metric Multidimensional Scaling with Euclidean distances
2 Torgerson Theorem
3 Interpretation of the results
4 Examples
5 Examples in SAS
6 Multidimensional scaling with dissimilarity metrics
7 Multidimensional scaling with ordinal dissimilarity
8 Examples
9 Examples in SAS
Prerequisites
This
course should be taken after passing the exam of Multivariate Statistical Analysis.
Teaching methods
The course consists of lectures and practical exercises in a lab with SAS software. The lectures will offer a theoretical background to the methods proposed, while the practical examples will be an application to real data.
Assessment methods
The final test is in written form with optional oral exam. The written test consists in two theoretical questions about the methods introduced in the course and a practical test in the laboratory, to be taken at the time of the theorical written exam with the SAS software, in analogy to what was done during the exercises. The theoretical questions allow to verify the knowledge of the goals, of the methods of resolution, of the comment of the results of the studied methods of exploratory data analysis. The ability to express oneself with an adequate technical language is required. The practical test aims to verify the ability to analyze real data sets using the most appropriate data analysis methods, adequately commenting and interpreting the results.
There are
no separate tests for attending students and non-attending students.
There are no intermediate tests in progress.
Textbooks and Reading Materials
Slides and reading material edited by the professor.
Johnson R. A., Wichern D. W., Applied Multivariate Statistical Analysis, Pearson, 2007.
Morrison D.F., Multivariate Statistical Methods, McGraw-Hill, 2004 (4° ed.).
Semester
2° semester 2° period
Teaching language
Italian