- Area di Scienze
- Corso di Laurea Magistrale
- Data Science [F9101Q]
- Insegnamenti
- A.A. 2021-2022
- 1° anno
- Statistical Modeling
- Introduzione
Syllabus del corso
Obiettivi formativi
Il corso ha quale obiettivo
lo studio di modelli lineari avanzati, partendo dal modello lineare classico fino ad arrivare ai modelli multivariati.
Contenuti sintetici
Il corso ha quale obiettivo lo studio di modelli più avanzati del modello lineare classico. Si presentano perciò
- modelli lineari generalizzati,
- modelli lineari multivariati
- modelli multilevel
Programma esteso
Il corso ha quale obiettivo l’introduzione alla specificazione, stima e verifica di modelli interpretativi dei dati di tipo lineare più avanzati del modello lineare classico. Si presentano perciò
· Modelli lineari che non rispettano le ipotesi del modello lineare classico: modelli con errori esteroschedastici e correlati, modelli non lineari, trattamento di outlier, modelli GLS
· Modelli lineari multivariati: dal modello classico multivariato al modello seemingly unrelated
· Modelli multilevel per dati gerarchici: la natura dei dati gerarchici, anova ad effetti fissi, modelli mixed (random slope, random intercept)
Ciascun ambito sarà l’oggetto specifico di un modulo del corso. L’attività formativa è svolta attraverso lezioni teoriche e lezioni pratiche in laboratorio statistico-informatico nelle quali si affronteranno analisi su casi empirici mediante l’uso dei software R e SAS. Il materiale del corso (sia delle lezioni teoriche sia delle lezioni pratiche) e ulteriori informazioni verranno riportate sulla pagina web dedicata nella piattaforma e-learning unimib: http://elearning.unimib.it/.
Prerequisiti
Statistica descrittiva univariata : indici di posizione; indici di variabilità:a; indici di simmetria e di curtosi.
Statistica descrittiva bivariata: connessione, dipendenza in media, correlazione lineare, regressione lineare bivariata, multipla, multivariata, polinomiale, non lineare.
Teoria della probabilità: popolazione e campione; significato di probabilità nella versione classica ; elementi di calcolo combinatorio; tipi di campionamento; distribuzioni di variabili casuali univariate; variabili casuali Normale , t di Student, F d Snedecor ; distribuzioni casuali campionarie
Inferenza: teoria della stima, proprietà dello stimatore puntuale; stima intervallare; verifica di ipotesi, test di ipotesi di Neyman Pearson; test di ipotesi sulle medie basati su Normale , t di Student; test d ipotesi sulla varianza.
Modello lineare classico: ipotesi; stima dei parametri del modello nel campione e nella popolazione; proprietà degli stimatori dei minimi quadrati; test di ipotesi sui parametri basati su Normale , t di Student, ; test di ipotesi sul modello e su gruppi di parametri , su un parametro basata F di Snedecor
Algebra delle matrici
Si suggerisce a chi non provenga da corsi triennali di statistica o economia di seguire preventivamente i corsi introduttivi del corso di laurea di biostatistica calcolo delle probabilità, introduzione all' inferenza stastistica, introduzione ai modelli statistici,modelli statistici per dati categoriali e conoscano i pacchetti statistici R o SAS.
Metodi didattici
Modalità di verifica dell'apprendimento
L'esame si svolge attraverso una prova da sostenere presso il laboratorio informatico e consiste in due domande di teoria e un esercizio pratico. L'esercizio riguarda uno dei temi proposti durante le esercitazioni svolte a lezione e riguarda la risoluzione di un problema tramite il software R o SAS e il commento ai risultati.
Testi di riferimento
Il principale testo di riferimento è la dispensa del corso, resa disponibile in formato digitale sulla piattaforma elearning. La dispensa contiene sia la parte teorica che esempi pratici.
Testi consigliati:
- Wooldridge, J. M. (2015). Introductory econometrics: A modern approach. Cengage learning.
- Freund, R. J., Wilson, W. J., and Sa, P. (2006), Regression Analysis: Statistical Modeling of a Response Variable, 2nd edition, Academic Press
- Baltagi B. H. (2008), Econometrics, fourth Edition, Springer Berlin
- Littell, R. C., Freund, R. J., and Spector, P. C. (2002), SAS for Linear Models, 4th Edition, Cary, NC: SAS Institute Inc.
-Rencher , A. C. ,Methods of Multivariate Analysis, Wiley
- Manual SAS/STAT 15.1
- Faraway, J. J. (2004). Linear models with R. Chapman and Hall/CRC.
Periodo di erogazione dell’insegnamento
III ciclo che corrisponde al 2 semestre nel periodo tra marzo e aprile.
Lingua di insegnamento
Italiano
Learning objectives
The aim of this course is the analysis of advanced linear models, from the classical linear model to the multivariate models.
Contents
- generalized linear models
- multivariate models
- multilevel models
Detailed program
The course aims at introducing at the specification, estimation and verification of the interpretative advanced linear models compared to the classical linear model. It also presents:
· Generalized linear models that do not meet the assumptions of the classical linear model: heteroschedastic models, autoregressive models, non-linear models, models with outliers, GLS
· Multivariate linear models: from least squares models to seemingly unrelated regressions
· Multilevel models: hierarchical data and fixed effects anova, mixed models (random slope, random intercept)
Each area will be the specific object of a course module. The course activity comprises theoretical lecture and lab activity with SAS and R. The material of the course (both the theoretical lessons both practical lessons) and additional information will be posted on the web page in the e-learning platform unimib: http://elearning.unimib.it/.
Prerequisites
It is requested a good knowledge of: Univariate descriptive statistics: position indeces; variability indices: symmetry and kurtosis indices. Bivariate descriptive statistics: connection, average dependence, linear correlation,linear bivariate, Multiple, multivariate, polynomial, non-linear regressions. Probability theory: population and sample; probability in the classic version; combinatorial calculation elements; sampling types; distributions of univariate random variables; random variables Normal, t of Student, F d Snedecor; random sampling distributions Inference:estimation theory, property of the punctual estimators; interval estimation;hypothesis tests: general theory, Neyman Pearson hypothesis tests, hypothesis tests on mean (Normal t of Student) and variance.
Basics of matrix algebra
Therefore student that do not have these previous knowledge in statistics are requested to attend biostastistics courses and pass exams of of: probability calculation, introduction to stastistical inference, introduction to statistical models, statistical models for data categorical . The students also have to know the R or SAS statistical packages. ( in the three-year degree or in the degree course of biostatistics) exams of: univariate and bivariate statististics, probability calculation, introduction to stastistical inference, introduction to statistical models, statistical models for data categorical . The students also have to know the R or SAS statistical packages.
Teaching methods
The course includes theoretical lecture and labs. In theoretical lecture, the methodological frameworks related to the course are presented and then applied during the practical labs. In the lab, SAS and R are going to be used with the aim to code and interpret model outputs. Lessons and exercises will be recorded on the e-learning platform
Assessment methods
The examination is carried out by means of a test at the computer laboratory and consists of two theoretical questions and a practical exercise. The exercise covers one of the topics proposed during the classroom exercises and involves solving a problem using R or SAS software and commenting on the results.
Textbooks and Reading Materials
-All the reading material is included in the course digital textbook uploaded on the elearning platform. The textbook covers both theoretical topics and practical examples.
Suggested readings
- Wooldridge, J. M. (2015). Introductory econometrics: A modern approach. Cengage learning.
-
Freund, R. J.,
Wilson, W. J.,
and Sa, P.
(2006), Regression Analysis:
Statistical Modeling of
a Response Variable,
2nd edition, Academic Press
- Baltagi B. H. (2008), Econometrics, fourth Edition, Springer Berlin
-
Littell, R. C., Freund, R. J., and
Spector, P. C.
(2002), SAS for Linear
Models, 4th Edition, Cary, NC: SAS Institute Inc.
-Rencher , A. C. ,Methods of Multivariate Analysis, Wiley
- Manual SAS/STAT 15.1
- Faraway, J. J. (2004). Linear models with R. Chapman and Hall/CRC.
Semester
3 cycle which corresponds to the 2nd semester in the period between March and April.
Teaching language
Italian