Vai al contenuto principale
Se prosegui nella navigazione del sito, ne accetti le politiche:
  • Condizioni di utilizzo e trattamento dei dati
Prosegui
x
e-Learning - UNIMIB
  • Home
  • Calendario
  • My Media
  • Altro
Ascolta questa pagina con ReadSpeaker
Italiano ‎(it)‎
English ‎(en)‎ Italiano ‎(it)‎
Ospite
 Login
e-Learning - UNIMIB
Home Calendario My Media
Percorso della pagina
  1. Area Economico-Statistica
  2. Corso di Laurea Magistrale
  3. Scienze Statistiche ed Economiche [F8206B - F8204B]
  4. Insegnamenti
  5. A.A. 2026-2027
  6. 1° anno
  1. Statistica Multivariata
  2. Introduzione
Unità didattica Titolo del corso
Statistica Multivariata
Codice identificativo del corso
2627-1-F8206B002-F8206B002-1
Descrizione del corso SYLLABUS

Blocchi

Torna a Statistica Avanzata M

Syllabus del corso

  • Italiano ‎(it)‎
  • English ‎(en)‎
Esporta

Obiettivi formativi

Il corso si pone come obiettivo quello di introdurre tecniche di analisi statistica multivatiata con finalità esplorativa e confermativa e di applicare tali metodologie a dati reali attraverso l'utilizzo del R (R Studio).

Al termine del corso, le studentesse e gli studenti saranno in grado di applicare le tecniche di analisi a dati raccolti in molteplici contesti, quali ad esempio quello economico, sociale, ambientale, e di interpretere i risultati dei suddetti modelli per l'analisi di fenomeni complessi e ad elevata dimensionalità.

Il corso contribuisce a consolidare le conoscenze nell'ambito delle metodologie statistiche e la capacità di applicare tali conoscenze, in coerenza con l'area di apprendimento di "Statistica" del corso di laurea magistrale in Scienze Statistiche ed Economiche.

Contenuti sintetici

I macro-argomenti principali del corso sono riportati di seguito.

  • Fondamenti di statistica multivariata: la normale multivariata
  • Metodi di classificazione
  • Metodi di riduzione dimensionale e modelli a variabili latenti
  • Metodi basati sulle distanze

Per maggiori dettagli si rimanda al "Programma esteso".

Programma esteso

  • Fondamenti di statistica multivariata: la normale multivariata
    • Definizione e introduzione alla distanza di Mahalanobis
    • Proprietà
    • Stima di massima verosimiglianza
    • Distribuzione degli stimatori di massima verosimiglianza e distribuzione di Wishart
    • Strumenti per la verifica dell'assunzione di normalità multivariata e trasformazione di Box-Cox multivariata
    • Cenni ad approcci per l'individuazione e il trattamento di dati mancanti e valori anomali
  • Metodi di classificazione
    • Classificazione con variabili continue
      • Analisi Discriminante Lineare (ADL)
      • Analisi Discriminante Lineare (ADQ)
    • Classificazione con variabili categoriali (miste)
      • Regressione Logistica (RL)
    • Confronto ADL, ADQ e RL
  • Metodi di riduzione dimensionale e modelli a variabili latenti
    • Variabili continue
      • Richiami di Analisi delle Componenti Principali (ACP) e Analisi Fattoriale Esplorativa (AFE)
      • Analisi Fattoriale Disgiunta e Analisi Fattoriale Confermativa
      • Modelli ad Equazioni Strutturali (Structural Equation Modelling, SEM)
    • Variabili categoriali
      • Cenni all'Analisi delle Corrispondenze Multiple (ACM)
      • Teoria di Risposta agli Item (Item Response Theory, IRT)
  • Metodi basati sulle distanze
    • Distanze e dissimilarità
    • Multidimensional Scaling (MDS)
    • Relazione tra MDS, ACP e ACM

Prerequisiti

Si presuppone la conoscenza delle nozioni di calcolo delle probabilità, inferenza statistica, programmazione, analisi esplorativa a livello dei corsi base di una laurea triennale in Scienze Statistiche.

Metodi didattici

Il corso è erogato in lingua italiana e prevede 47 ore tra lezioni frontali e sessioni di laboratorio svolte in modalità interattiva.

Le lezioni frontali tratteranno l'introduzione e l'approfondimento delle metodologie statistiche oggetto del corso e relativi esercizi; le sessioni di laboratorio si focalizzeranno invece sulla applicazione delle suddette metodologie a dati reali mediante l'utilizzo del software R (R Studio).

Le lezioni frontali e le sessioni di laboratorio saranno erogate in presenza. Alcune lezioni potranno essere erogate a distanza (da remoto) fino ad un massimo del 20% delle ore.

Modalità di verifica dell'apprendimento

L'esame consiste in una prova scritta che si compone di domande di teoria, esercizi numerici da svolgere in forma cartacea e tramite l'utilizzo di R Studio.

Non sono previste prove in itinere.

Testi di riferimento

  • Rencher, A. C. , Christensen, W. F. (2012). Methods of Multivariate Analysis (3rd ed.). Wiley.
  • Hastie, T., Tibshirani, R., Friedman, J. (2009). The Elements of Statistical Learning: Data Mining, Inference, and Prediction (2nd ed.). Stanford, CA: Stanford University.
    Slides, note e appunti della docente.
  • Adachi, K. (2020) Matrix-Based Introduction to Multivariate Data Analysis (2nd ed.). Springer.

Periodo di erogazione dell'insegnamento

Il corso è erogato nel secondo periodo del primo semestre.

Lingua di insegnamento

Italiano

Sustainable Development Goals

ISTRUZIONE DI QUALITÁ
Esporta

Learning objectives

The aim of the course is to introduce multivariate statistical techniques for exploratory purposes and to apply these methodologies to real data through the use of R (R Studio).

By the end of the course, students will be able to apply the aforementioned techniques to real data sets collected in several contexts, e.g., economics, social and environmental fields, and to interpret the results of the corresponding models for the analysis of complex and high-dimensional phenomena.

The course contributes to strengthening knowledge in statistical methodologies and the ability to apply such knowledge, in line with the "Statistics" learning area of the Master’s Degree in Statistics and Economics.

Contents

The main macro-topics of the course are listed below.

  • Fundamentals of multivariate statistics: the multivariate normal distribution
  • Classification methods
  • Dimensionality reduction methods and latent variable models
  • Distance-based methods

For further details, see the “Detailed Programme”.

Detailed program

  • Fundamentals of multivariate statistics: the multivariate normal distribution
    • Definition and introduction to the Mahalanobis distance
    • Properties
    • Maximum likelihood estimation
    • Distribution of the maximum likelihood estimators and Wishart distribution
    • Tools for assessing the normality assumption and multivariate Box-Cox transformation
    • Introduction to methods for identifying and handling missing data and outliers
  • Classification methods
    • Classification for continuous variables
      • Linear Discriminant Analysis (LDA)
      • Quadratic Discriminant Analysis (QDA)
    • Classification for categorical (mixed) variables
      • Logistic Regression (LR)
    • Comparison between LDA, QDA and LR
  • Dimensionality reduction methods and latent variable models
    • Continuous variables
      • Review of Principal Component Analysis (PCA) and Exploratory Factor Analysis (EFA)
      • Structural Equation Modelling (SEM)
    • Categorical variables
      • Introduction to Mutiple Correspondence Analysis (MCA)
      • Item Response Theory (IRT)
  • Distance-based methods
    • Distances and dissimilarities
    • Multidimensional Scaling (MDS)
    • Relationships among MDS, PCA and MCA

Prerequisites

Students are expected to have a basic background in probability theory, statistical inference, programming, and exploratory data analysis, equivalent to that provided by an undergraduate degree in Statistical Sciences.

Teaching methods

The course is in Italian and consists of 47 hours of lectures and laboratory sessions conducted in an interactive format.

The lectures will cover the introduction and in-depth study of the statistical methodologies addressed in the course, along with related exercises; the laboratory sessions will focus on the application of the aforementioned methodologies to real data sets using the R (R Studio) software.

Both lectures and laboratory sessions will be conducted in person. Some lectures may be conducted remotely, for up to 20% of the total hours.

Assessment methods

The exam is a written test consisting of theoretical questions, numerical exercises, and numerical exercises to be completed using R.

There are no mid-term exams.

Textbooks and Reading Materials

  • Rencher, A. C. , Christensen, W. F. (2012). Methods of Multivariate Analysis (3rd ed.). Wiley.
  • Hastie, T., Tibshirani, R., Friedman, J. (2009). The Elements of Statistical Learning: Data Mining, Inference, and Prediction (2nd ed.). Stanford, CA: Stanford University.
    Slides, note e appunti della docente.
  • Adachi, K. (2020) Matrix-Based Introduction to Multivariate Data Analysis (2nd ed.). Springer.

Semester

The course is scheduled in the second term of the first semester.

Teaching language

Italian

Sustainable Development Goals

QUALITY EDUCATION
Entra

Scheda del corso

Settore disciplinare
STAT-01/A
CFU
6
Periodo
Annualità Singola
Tipo di attività
Obbligatorio
Ore
47
Tipologia CdS
Laurea Magistrale
Lingua
Italiano

Staff

    Docente

  • GZ
    Giorgia Zaccaria

Metodi di iscrizione

Iscrizione manuale

Obiettivi di sviluppo sostenibile

ISTRUZIONE DI QUALITÁ - Assicurare un'istruzione di qualità, equa ed inclusiva, e promuovere opportunità di apprendimento permanente per tutti
ISTRUZIONE DI QUALITÁ

Ospite (Login)
Politiche
Ottieni l'app mobile
Powered by Moodle
© 2026 Università degli Studi di Milano-Bicocca
  • Privacy
  • Accessibilità
  • Statistiche