Skip to main content
If you continue browsing this website, you agree to our policies:
  • Condizioni di utilizzo e trattamento dei dati
Continue
x
e-Learning - UNIMIB
  • Home
  • Calendar
  • My Media
  • More
Listen to this page using ReadSpeaker
English ‎(en)‎
English ‎(en)‎ Italiano ‎(it)‎
You are currently using guest access
 Log in
e-Learning - UNIMIB
Home Calendar My Media
Percorso della pagina
  1. Economics
  2. Master Degree
  3. Scienze Statistiche ed Economiche [F8206B - F8204B]
  4. Courses
  5. A.A. 2026-2027
  6. 1st year
  1. Multivariate Statistics
  2. Summary
Unità didattica Course full name
Multivariate Statistics
Course ID number
2627-1-F8206B002-F8206B002-1
Course summary SYLLABUS

Blocks

Back to Advanced Statistics M

Course Syllabus

  • Italiano ‎(it)‎
  • English ‎(en)‎
Export

Obiettivi formativi

Il corso si pone come obiettivo quello di introdurre tecniche di analisi statistica multivatiata con finalità esplorativa e confermativa e di applicare tali metodologie a dati reali attraverso l'utilizzo del R (R Studio).

Al termine del corso, le studentesse e gli studenti saranno in grado di applicare le tecniche di analisi a dati raccolti in molteplici contesti, quali ad esempio quello economico, sociale, ambientale, e di interpretere i risultati dei suddetti modelli per l'analisi di fenomeni complessi e ad elevata dimensionalità.

Il corso contribuisce a consolidare le conoscenze nell'ambito delle metodologie statistiche e la capacità di applicare tali conoscenze, in coerenza con l'area di apprendimento di "Statistica" del corso di laurea magistrale in Scienze Statistiche ed Economiche.

Contenuti sintetici

I macro-argomenti principali del corso sono riportati di seguito.

  • Fondamenti di statistica multivariata: la normale multivariata
  • Metodi di classificazione
  • Metodi di riduzione dimensionale e modelli a variabili latenti
  • Metodi basati sulle distanze

Per maggiori dettagli si rimanda al "Programma esteso".

Programma esteso

  • Fondamenti di statistica multivariata: la normale multivariata
    • Definizione e introduzione alla distanza di Mahalanobis
    • Proprietà
    • Stima di massima verosimiglianza
    • Distribuzione degli stimatori di massima verosimiglianza e distribuzione di Wishart
    • Strumenti per la verifica dell'assunzione di normalità multivariata e trasformazione di Box-Cox multivariata
    • Cenni ad approcci per l'individuazione e il trattamento di dati mancanti e valori anomali
  • Metodi di classificazione
    • Classificazione con variabili continue
      • Analisi Discriminante Lineare (ADL)
      • Analisi Discriminante Lineare (ADQ)
    • Classificazione con variabili categoriali (miste)
      • Regressione Logistica (RL)
    • Confronto ADL, ADQ e RL
  • Metodi di riduzione dimensionale e modelli a variabili latenti
    • Variabili continue
      • Richiami di Analisi delle Componenti Principali (ACP) e Analisi Fattoriale Esplorativa (AFE)
      • Analisi Fattoriale Disgiunta e Analisi Fattoriale Confermativa
      • Modelli ad Equazioni Strutturali (Structural Equation Modelling, SEM)
    • Variabili categoriali
      • Cenni all'Analisi delle Corrispondenze Multiple (ACM)
      • Teoria di Risposta agli Item (Item Response Theory, IRT)
  • Metodi basati sulle distanze
    • Distanze e dissimilarità
    • Multidimensional Scaling (MDS)
    • Relazione tra MDS, ACP e ACM

Prerequisiti

Si presuppone la conoscenza delle nozioni di calcolo delle probabilità, inferenza statistica, programmazione, analisi esplorativa a livello dei corsi base di una laurea triennale in Scienze Statistiche.

Metodi didattici

Il corso è erogato in lingua italiana e prevede 47 ore tra lezioni frontali e sessioni di laboratorio svolte in modalità interattiva.

Le lezioni frontali tratteranno l'introduzione e l'approfondimento delle metodologie statistiche oggetto del corso e relativi esercizi; le sessioni di laboratorio si focalizzeranno invece sulla applicazione delle suddette metodologie a dati reali mediante l'utilizzo del software R (R Studio).

Le lezioni frontali e le sessioni di laboratorio saranno erogate in presenza. Alcune lezioni potranno essere erogate a distanza (da remoto) fino ad un massimo del 20% delle ore.

Modalità di verifica dell'apprendimento

L'esame consiste in una prova scritta che si compone di domande di teoria, esercizi numerici da svolgere in forma cartacea e tramite l'utilizzo di R Studio.

Non sono previste prove in itinere.

Testi di riferimento

  • Rencher, A. C. , Christensen, W. F. (2012). Methods of Multivariate Analysis (3rd ed.). Wiley.
  • Hastie, T., Tibshirani, R., Friedman, J. (2009). The Elements of Statistical Learning: Data Mining, Inference, and Prediction (2nd ed.). Stanford, CA: Stanford University.
    Slides, note e appunti della docente.
  • Adachi, K. (2020) Matrix-Based Introduction to Multivariate Data Analysis (2nd ed.). Springer.

Periodo di erogazione dell'insegnamento

Il corso è erogato nel secondo periodo del primo semestre.

Lingua di insegnamento

Italiano

Sustainable Development Goals

ISTRUZIONE DI QUALITÁ
Export

Learning objectives

The aim of the course is to introduce multivariate statistical techniques for exploratory purposes and to apply these methodologies to real data through the use of R (R Studio).

By the end of the course, students will be able to apply the aforementioned techniques to real data sets collected in several contexts, e.g., economics, social and environmental fields, and to interpret the results of the corresponding models for the analysis of complex and high-dimensional phenomena.

The course contributes to strengthening knowledge in statistical methodologies and the ability to apply such knowledge, in line with the "Statistics" learning area of the Master’s Degree in Statistics and Economics.

Contents

The main macro-topics of the course are listed below.

  • Fundamentals of multivariate statistics: the multivariate normal distribution
  • Classification methods
  • Dimensionality reduction methods and latent variable models
  • Distance-based methods

For further details, see the “Detailed Programme”.

Detailed program

  • Fundamentals of multivariate statistics: the multivariate normal distribution
    • Definition and introduction to the Mahalanobis distance
    • Properties
    • Maximum likelihood estimation
    • Distribution of the maximum likelihood estimators and Wishart distribution
    • Tools for assessing the normality assumption and multivariate Box-Cox transformation
    • Introduction to methods for identifying and handling missing data and outliers
  • Classification methods
    • Classification for continuous variables
      • Linear Discriminant Analysis (LDA)
      • Quadratic Discriminant Analysis (QDA)
    • Classification for categorical (mixed) variables
      • Logistic Regression (LR)
    • Comparison between LDA, QDA and LR
  • Dimensionality reduction methods and latent variable models
    • Continuous variables
      • Review of Principal Component Analysis (PCA) and Exploratory Factor Analysis (EFA)
      • Structural Equation Modelling (SEM)
    • Categorical variables
      • Introduction to Mutiple Correspondence Analysis (MCA)
      • Item Response Theory (IRT)
  • Distance-based methods
    • Distances and dissimilarities
    • Multidimensional Scaling (MDS)
    • Relationships among MDS, PCA and MCA

Prerequisites

Students are expected to have a basic background in probability theory, statistical inference, programming, and exploratory data analysis, equivalent to that provided by an undergraduate degree in Statistical Sciences.

Teaching methods

The course is in Italian and consists of 47 hours of lectures and laboratory sessions conducted in an interactive format.

The lectures will cover the introduction and in-depth study of the statistical methodologies addressed in the course, along with related exercises; the laboratory sessions will focus on the application of the aforementioned methodologies to real data sets using the R (R Studio) software.

Both lectures and laboratory sessions will be conducted in person. Some lectures may be conducted remotely, for up to 20% of the total hours.

Assessment methods

The exam is a written test consisting of theoretical questions, numerical exercises, and numerical exercises to be completed using R.

There are no mid-term exams.

Textbooks and Reading Materials

  • Rencher, A. C. , Christensen, W. F. (2012). Methods of Multivariate Analysis (3rd ed.). Wiley.
  • Hastie, T., Tibshirani, R., Friedman, J. (2009). The Elements of Statistical Learning: Data Mining, Inference, and Prediction (2nd ed.). Stanford, CA: Stanford University.
    Slides, note e appunti della docente.
  • Adachi, K. (2020) Matrix-Based Introduction to Multivariate Data Analysis (2nd ed.). Springer.

Semester

The course is scheduled in the second term of the first semester.

Teaching language

Italian

Sustainable Development Goals

QUALITY EDUCATION
Enter

Key information

Field of research
STAT-01/A
ECTS
6
Term
Annual
Activity type
Mandatory
Course Length (Hours)
47
Degree Course Type
2-year Master Degree
Language
Italian

Staff

    Teacher

  • GZ
    Giorgia Zaccaria

Enrolment methods

Manual enrolments

Sustainable Development Goals

QUALITY EDUCATION - Ensure inclusive and equitable quality education and promote lifelong learning opportunities for all
QUALITY EDUCATION

You are currently using guest access (Log in)
Policies
Get the mobile app
Powered by Moodle
© 2026 Università degli Studi di Milano-Bicocca
  • Privacy policy
  • Accessibility
  • Statistics