Vai al contenuto principale
e-Learning - UNIMIB
  • Italiano ‎(it)‎
    English ‎(en)‎ Italiano ‎(it)‎
  • Ascolta questa pagina con ReadSpeaker
  •  Login
Home
Percorso della pagina
  1. Area Economico-Statistica
  2. Corso di Laurea Magistrale
  3. Biostatistica [F8203B]
  4. Insegnamenti
  5. A.A. 2018-2019
  6. 1° anno
  1. Modelli Lineari per Dati Categoriali
  2. Introduzione
Unità didattica Titolo del corso
Modelli Lineari per Dati Categoriali
Codice identificativo del corso
1819-1-F8203B010-F8203B011M
Descrizione del corso SYLLABUS
Torna a Modelli Statistici I

Syllabus del corso

  • Italiano ‎(it)‎
  • English ‎(en)‎
Esporta

Obiettivi formativi

Il corso ha quale obiettivo la trattazione dei modelli lineari per dati categoriali secondo due diverse impostazioni. La prima riguarda il modello lineare generale (GLM), in particolare i modelli ANOVA ad una o più vie e il modello ANCOVA. La seconda impostazione riguarda i modelli lineari generalizzati, in particolare il modello log-lineare di Poisson per dati di conteggio e il modello logistico binomiale, in un’ottica di GLM. L’analisi dei casi empirici è svolta con il software SAS.

Contenuti sintetici

Modello lineare generale (GLM), modello ANOVA a una e più vie e modello ANCOVA. Modelli lineari generalizzati (GzLM), modello logistico binomiale e modello log-lineare di Poisson. Applicazioni a dati reali e sperimentali con il software SAS.

Programma esteso

  • La teoria del modello lineare generale (GLM): specificazione del modello, inversa generalizzata, funzioni stimabili, ipotesi testabili. Relazione con il metodo di stima dei minimi quadrati vincolati: approcci sum-to-zero e set-to-zero linear constraints. Parametrizzazione degli effetti e della categoria di riferimento. Contrasti
  • Casi particolari di GLM: modelli ANOVA ad effetti fissi a una e a più vie, modello ANCOVA. PROC GLM di SAS
  • Selezione del GLM: metodi forward e stepwise. PROC GLMSELECT di SAS
  • Modelli lineari generalizzati (GzLM): legge di distribuzione della variabile risposta, funzione link, specificazione del modello, metodo di stima di massima verosimiglianza, proprietà degli stimatori, bontà di adattamento del modello, intervalli di confidenza e verifica di ipotesi
  • Casi particolari di GzLM: modello log-lineare di Poisson per dati di conteggio e modello logistico binomiale, in un’ottica di GLM. PROC GENMOD di SAS

Prerequisiti

Per questa attività formativa è consigliata la conoscenza degli argomenti trattati nei corsi di base di Analisi Statistica Multivariata

Metodi didattici

Lezioni teoriche in aula ed esercitazioni pratiche in laboratorio statistico-informatico con il software SAS

Modalità di verifica dell'apprendimento

L'esame consiste nella preparazione di un'analisi statistica di dati con il software SAS (secondo le modalità specificate sulla piattaforma e-learning del corso), che dovrà essere poi discussa in sede d'esame, e in una prova scritta (durata: 2 ore) che ha ad oggetto argomenti sia a natura teorica sia a natura pratica. Le domande a natura teorica sono di carattere generale. Le parti con natura più metodologica sono oggetto di una domanda facoltativa.

Relativamente alla parte puramente applicativa si richiede di preparare con il software SAS un'analisi di dati sulla base di una delle metodologie trattate durante il corso. Il commento dell'analisi così prodotta è oggetto di discussione in sede d'esame.

La metodologia in base alla quale preparare l'analisi viene assegnata nominalmente e in modo casuale (mediante l'ausilio di un generatore di numeri casuali) a ciascuno studente iscritto alla piattaforma e-learning del corso. 

L'analisi statistica deve essere preparata prima della prova d'esame seguendo una traccia specifica relativa alla metodologia assegnata e pubblicata alla fine del corso sulla piattaforma e-learning. In sede d'esame si dovrà poi presentare la stampa dell'output secondo le modalità specificate sulla piattaforma e-learning del corso.

Considerata l'abbondanza di materiale didattico messo a disposizione dalla docente sulla piattaforma e-learning del corso, non si prevede alcuna distinzione fra esami per studenti frequentanti ed esami per studenti non frequentanti.

Testi di riferimento

  • Materiale didattico della docente pubblicato sul sito e-learning del corso
  • Agresti, A. (2002), Categorical Data Analysis, Second Edition, New York: John Wiley & Sons
  • Dobson, A. (1990), An Introduction to Generalized Linear Models, London: Chapman & Hall
  • Littell, R. C., Freund, R. J., and Spector, P. C. (2002), SAS for Linear Models, 4th Edition, Cary, NC: SAS Institute Inc.
  • Searle, S. R. (1971), Linear Models, New York: John Wiley & Sons

Periodo di erogazione dell’insegnamento

I Semestre, II ciclo

Lingua di insegnamento

Italiano

Esporta

Learning objectives

The course introduces the linear models for categorical data according to two different settings. The first concerns the general linear model (GLM), including several special cases such as ANOVA and ANCOVA models. The second setting deals with the generalized linear models, in particular Poisson log-linear models for count data and binomial logistic models, in a GLM perspective. Analyses of empirical cases are carried out through the SAS software.

Contents

General Linear Model (GLM), one-way or more than one-way ANOVA and ANCOVA models. Generalized Linear Models (GzLM), binomial logistic model and Poisson log-linear model. Applications to real and experimental data with the SAS software.

Detailed program

  • Theory of general linear model (GLM): model specification, assumptions, generalized inverse, estimable functions, testable hypotheses. Link with the constrained least-squares estimation method. Sum-to-zero and set-to-zero linear constraint approaches. Effect parameterization vs. reference category parameterization. Contrasts
  • Special cases of GLM: one-way or more than one-way fixed-effects ANOVA models, ANCOVA model. SAS PROC GLM
  • GLM selection: forward and stepwise methods. SAS PROC GLMSELECT
  • Generalized Linear Model (GzLM): probability distribution function of response variables, link function, model specification, maximum likelihood estimation method, estimator properties, criteria for goodness-of-fit, confidence limits and statistical testing hypotheses
  • Special cases of GzLM: Poisson log-linear model for count data and binomial logistic model, in a GLM perspective. SAS PROC GENMOD

Prerequisites

Knowledge of the topics covered in undergraduate courses of Multivariate Statistical Analysis is recommended

Teaching methods

Theoretical lectures in the classroom and practical exercises in the statistical-informatics laboratory with SAS software

Assessment methods

The exam consists in the preparation of a statistical data analysis with the SAS software (according to the modalities specified on the e-learning platform of the course),  whose output has to be discussed during the examination, and in a written test (duration: 2 hours) concerning both theoretical and practical topics. The theoretical questions are general. The parts with a more methodological nature are the object of an optional issue.

Concerning the purely applicative part, it is required to prepare a data analysis with the SAS software using one of the methodologies covered during the course. The comment of the analysis thus produced is the object of discussion during the examination.

The methodology for preparing the analysis is assigned nominally and randomly (using a random number generator) to each student enrolled in the e-learning platform of the course.

The statistical analysis has to be prepared before the exam, following a specific track relative to the methodology assigned and published at the end of the course on the e-learning platform. During the examination, the printing of the output has then to be presented according to the modalities specified on the e-learning platform of the course.

Given the abundance of teaching material uploaded on the e-learning platform of the course, no distinction is made between exams for attending students and exams for non-attending students.

Textbooks and Reading Materials

  • Teaching material uploaded on the e-learning website of the course
  • Agresti, A. (2002), Categorical Data Analysis, Second Edition, New York: John Wiley & Sons
  • Dobson, A. (1990), An Introduction to Generalized Linear Models, London: Chapman & Hall
  • Littell, R. C., Freund, R. J., and Spector, P. C. (2002), SAS for Linear Models, 4th Edition, Cary, NC: SAS Institute Inc.
  • Searle, S. R. (1971), Linear Models, New York: John Wiley & Sons

Semester

First semester, second period

Teaching language

Italian

Entra

Scheda del corso

Settore disciplinare
SECS-S/01
CFU
6
Periodo
Annualità Singola
Tipo di attività
Obbligatorio
Ore
42
Tipologia CdS
Laurea Magistrale

Metodi di iscrizione

  • Iscrizione manuale
  • Iscrizione spontanea con chiave - Studenti modulo MLDC
  • Collegamento meta corso (Modelli Statistici I [1819-1-F8203B010])

Staff

    Docente

  • Nadia Solaro

  • Modelli Lineari per Dati Categoriali
  • Home
Ottieni l'app mobile
Politiche
© 2023 Università degli Studi di Milano-Bicocca