Syllabus del corso
Obiettivi formativi
Il corso ha un taglio principalmente pratico-applicativo e si pone i seguenti obiettivi:
Conoscenza e comprensione: Introduzione e livellamento degli studenti al ragionamento statistico e ai metodi statistici di base metodologici per la raccolta di dati e per la loro trasformazione in informazioni utili al processo decisionale e alla produzione di evidenza empirica a supporto dell’analisi del rischio sociale e dell’insicurezza in ambito urbano e territoriale.
**Capacità di applicare conoscenza e comprensione: **Introduzione agli aspetti sia teorici sia applicativi di modelli statistici (anche computazionali) per la previsione del rischio sociale e dell’insicurezza in ambito urbano e territoriale.
Alla fine del corso, gli studenti saranno in grado di selezionare fonti di dati attendibili, creare il proprio data set ed applicare in autonomia metodi statistici di base per l’analisi e la previsione di fenomeni di rischio sociale, valutandone consapevolmente l'efficacia, l’interpretazione e la divulgazione dei risultati. In particolare gli studenti sapranno:
- Scaricare e costruire dataset autonomamente
- Utilizzare consapevolmente fonti di dati attendibili
- Trasformare dati in informazioni
- Riconoscere e trattare consapevolmente dati di survey, errore campionario e bias, disegno di campionamento e nota metodologica.
- Utilizzare le conoscenze teoriche e metodologiche per costruire indicatori di rischio sociale
- Sviluppare le competenze necessarie per applicare gli indicatori di rischio sociale all'analisi di casi concreti
- Promuovere le capacità di utilizzo degli indicatori di rischio sociale, per la progettazione di interventi di prevenzione e sostegno
Contenuti sintetici
Il corso si propone di trasmettere conoscenze e competenze essenziali in materia di raccolta e analisi di dati per la ricerca quantitativa, competenze sia metodologiche sia applicative.
Gli aspetti applicativi sono affrontati attraverso esercitazioni pratiche e casi studio integrati al corso. Durante il corso sono resi disponibili strumenti online sulla pagina e-learning, di approfondimento e di esercitazione autonoma, (si veda la sezione “Metodi didattici”).
In particolare sono forniti strumenti di statistica e di calcolo automatizzato, per la produzione di evidenze empiriche e per le decisioni data-driven, orientate all’analisi del rischio sociale nello spazio urbano. Il corso si compone di due parti:
Parte 1 equivalente a 2 CFU - 14h di lezione frontali:
con obiettivo didattico introduttivo e di livellamento, e contenuti di ragionamento statistico e strumentazione statistica metodologica.
Parte 2 equivalente a 6 CFU - 42h di lezioni frontali:
con obiettivi didattici applicativi e approccio problem solving, svolto in laboratorio informatico e comprensivo di introduzione a un software di calcolo (Excel) ed eventuali cenni all'utilizzo di script di codice su Rstudio.
I contenuti vertono sulla costruzione di basi dati e sull’applicazione di strumentazione statistica orientate all’analisi del rischio sociale (strumentazione statistica presentata nella Parte 1 e ulteriormente sviluppata nella Parte 2), sull’interpretazione e sulla divulgazione dei risultati.
Programma esteso
Parte 1 2 CFU , 14h: Ragionamento statistico e strumenti di analisi statistica
- Richiami a concetti statistici di base
- Obiettivi e funzioni della Statistica: descrittiva, inferenziale, controllo e gestione dell’incertezza/errore statistico e di stima/mis-informazione/integrazione di dati da fonti diverse
- Dati: natura del dato, dati campionari & Big Data, disegno campionario (overview)
- Fonti (overview basi dati & survey ufficiali ISTAT, UN,UNSD,SHARE,DHS), qualità vs quantità
- Trasformare il dato in informazione: Indicatori statistici & Stime (Proporzioni, Rapporti, Valori medi, deviazioni e variabilità);
- Normalizzazione x valutare, Standardizzazione per confrontare
- Modelli statistici per la previsione: obiettivi e overview
Parte 2 6 CFU, 42h: Basi Dati e Analisi Statistica orientati alla gestione e prevenzione dei rischi e dell’insicurezza in ambito urbano e territoriale:
- Introduzione al software applicativo Excel: creazione di tabelle/basi di dati e funzioni statistiche
- Fonti di Dati Ufficiali
- Dati da survey: nota metodologica, disegno campionario e weighting, pesi di disegno e (cenni alle correzioni successive: missing & calibrazione)
- Costruzione, applicazione, analisi e visualizzazione di indicatori di rischio sociale (criteri di selezione, esempi di indicatori socio-demografici, di esclusione e coesione sociale e di sicurezza urbana)
- Casi studio di applicazione, valutazione e prevenzione, indicatori di rischio sociale
- Introduzione di Modelli statistici per la previsione del rischio sociale:
-Regressione logistica, fitting & misura affidabilità
-Alberi decisionali : fitting & misura affidabilità - Introduzione al Machine Learning:
-Random Forrest (caso studio) - Lavoro interattivo al computer in preparazione del progetto di gruppo o individuale per l’esame finale
Prerequisiti
Competenze base di matematica e calcolo.
Competenze base di metodi di ricerca quantitativa.
Metodi didattici
Parte 1: 100% Didattica erogativa con lezioni frontali e utilizzo di slide
Parte 2: 30% Didattica erogativa con lezioni frontali e utilizzo di slide,
70% Didattica interattiva con esercitazioni al computer, casi studio, sviluppo di progetti, costruzione di data set ed analisi statistica i in preparazione all’esame
Durante il corso, la pagina elearning https://elearning.unimib.it è regolarmente aggiornata con ulteriore materiale didattico, incluso
- Anticipo degli argomenti delle lezioni della settimana
- Slide delle lezioni concluse
- Forum domande/risposte e Lavagna online (anonima) domande/dubbi/commenti
Le regole di svolgimento e valutazione dell’esame finale sono descritte in dettaglio e pubblicate sulla pagina e-learning all'inizio del semestre.
Modalità di verifica dell'apprendimento
Elaborazione e produzione di un report (elaborato scritto o slide) da esporre oralmente, sulla base di un un progetto a scelta, svolto individualmente o in gruppo (con presentazioni individuali del proprio ruolo nel gruppo).
Ulteriore indicazioni saranno fornite durante il corso e sulla pagina e-learning.
Testi di riferimento
Slides delle lezioni, dispense e altro materiale didattico sarà reso disponibile sulla pagina e-learning e integrato durante il corso.
Testi di utile consultazione:
F.Mecatti “Statistica di Base. Come, Quando e Perchè”. McGraw Hill, III Edizione 2022 (Parte 1)
Ad Feelders “Introduction to Intelligent Data Analysis”. November 18, 2003 (pp 137-148) (Parte 2)
James G., Witten D., Hastie T., Tibshirani R. (2021). An Introduction to Statistical Learning: with Applications in R, Springer Publishing Company. (Chapters 4 and 8 - Parte 2)
P.Giudici, S.Figini (2009) Applied Data Mining for Business and Industry Second Edition Wiley (Capitoli 4.4 - 4.5 - 4.12 Parte 2)
Misurare la corruzione oggi Obiettivi, metodi, esperienze a cura di Michela Gnaldi, Benedetto Ponti, Franco Angeli, 2018 (Parte 2)
Sustainable Development Goals
Learning objectives
The course has a practical-applicative main focus and the following objectives:
Knowledge and understanding: To introduce and level students to statistical reasoning and basic statistical methods for collecting data and transforming them into useful information for decision-making and producing empirical evidence to support social risk analysis and security issues in urban and territorial contexts.
Ability to apply knowledge and understanding: Intorducing to both theoretical and applicative aspects of statistical models (and computational models) for social risk and insecurity issues prediction.
At the end of the course, students will be able to select reliable data sources, create their own data set and apply basic statistical methods for the analysis and prediction of social risk phenomena. In addition they will be able to assess accuracy of statistical results, and effectively interpret and disseminate them. In particular, students will know how to:
- Download and build datasets autonomously
- Knowingly select and use reliable data sources
- Transforming data into information
- Recognize and thoughtfully treat survey data, with awarness of sampling error and bias, sampling design and methodological note.
- Use theoretical and methodological statistical knowledge to build social risk indicators
- Develop skills to apply social risk indicators to the analysis of real case studies
- Promote the ability to use social risk indicators to support policies and risk prevention
Contents
The course aims to deliver essential knowledge, both methodological and applied, in the field of data collection and analysis for quantitative research. Applicative aspects are addressed through practical exercises and case studies integrated into the course. Online tools and opportunities for independent practice are made available on the e-learning page during teaching (see the "Teaching methods" section). In particular, statistical and computerised tools are provided to produce empirical evidence and data-driven decisions focused on analyzing social risk in urban spaces.
The course consists of two parts:
Part 1 equivalent to 2 CFU - 14h frontal lessons:
with an introductory, leveling didactical purpose. Contents are element of statistical reasoning and essentialstatistical methods.
Part 2 equivalent to 6 CFU - 42h frontal lessons:
With practical, applied purposes and problem solving approach, with classes delivered in computer lab. The introduction to Microsoft Excel as a computational software will be included together with hints on the use of code scripts on Rstudio (to be evaluated during the course). The content focuses on the construction of databases and the application of statistical tools to analyse social risk (statistical methods and tools presented in Part 1 and further developed in Part 2), on the interpretation and dissemination of the results.
Detailed program
Part 1 2 CFU, 14h: Statistical reasoning and statistical methods
- Overview of basic statistical concepts and tools: Objectives and functions of Statistics: descriptive, inferential, control and management of uncertainty/statistical error and estimation/mis-information/integration of data from different sources
- Data: nature of the data, sample data & Big Data, sample design (overview)
- Sources (overview databases & official surveys ISTAT, UN,UNSD,SHARE,DHS), quality vs quantity
- Transforming data into information: Statistical indicators & Estimates (Proportions, Ratios, Average values, deviations and variability);
- Normalisation to evaluate vs Standardisation to compare
- Statistical models for prediction: objectives and overview
Part 2 6 CFU, 42h: Databases and Statistical Analysis for managing and prevention of risks and security issues in urban and territorial contexts
- Introduction to Excel: creation of tables/databases and statistical functions
- Official Statistics data sources
- Survey data: methodological note, sample design and weighting, design weights and (notes to corrections: missing & calibration)
- Construction, application, analysis and visualization of social risk indicators (selection criteria, examples of socio-demographic, exclusion and social cohesion and urban security indicators)
- Case studies: application, evaluation and prevention of social risk indicators
- Introduction of statistical models for social risk prediction:
-Logistic regression, fitting & reliability measurement
-Decision trees: fitting & reliability measurement - Introduction to Machine Learning:
-Random Forrest (case study) - Interactive computer-based work to prepare group or individual projects for the final exam
Prerequisites
Basic mathematical and computational competencies.
Basic competencies of quantitative research methodology.
Teaching methods
Part 1: 100% lecture-based teaching with frontal lessons and use of slides
Part 2: 30% lecture-based teaching with frontal lessons and use of slides,
70% interactive teaching with computer exercises, case studies, project development, construction of data sets and statistical analysis in preparation for the exam
During the course, the elearning page https://elearning.unimib.it is regularly updated with further teaching material, including:
- weekly preview of the lecture topics
- Slides of the completed lessons
- Q&A Forum and online board (anonymous) for questions/doubts/comments posting
Assessment methods
"Preparation and delivery of a report (written paper or slides) to be presented orally on a chosen project, either individually or as a group. For group projects, each member will present their specific contributions individually.
Further information will be provided during the course and posted on the e-learning page.
Textbooks and Reading Materials
Lecture slides, handouts and other teaching/reading material will be made available on the e-learning page and integrated during classes
Other Useful reference texts:
F.Mecatti “Statistica di Base. Come, Quando e Perchè”. McGraw Hill, III Edizione 2022 (Part 1)
Ad Feelders “Introduction to Intelligent Data Analysis”. November 18, 2003 (pp 137-148) (Part 2)
James G., Witten D., Hastie T., Tibshirani R. (2021). An Introduction to Statistical Learning: with Applications in R, Springer Publishing Company. (Chapters 4 and 8 - Part 2)
Applied Data Mining for Business and Industry Second Edition PAOLO GIUDICI, SILVIA FIGINI, Wiley, 2009 (Capitoli 4.4 - 4.5 - 4.12 Part 2)
Misurare la corruzione oggi Obiettivi, metodi, esperienze a cura di Michela Gnaldi, Benedetto Ponti, Franco Angeli, 2018 (Part 2)
English textbooks and additional digital resources will be advised on demand and/or according to specific needs