Course Syllabus
Obiettivi formativi
Il corso ha un taglio principalmente pratico-applicativo e si propone di fornire agli studenti e alle studentesse conoscenze e competenze di base per l’analisi statistica dei dati sulla sicurezza, dall'acquisizione dei dati fino all’analisi predittiva.
Conoscenza e comprensione
Al termine del corso, gli studenti e le studentesse avranno acquisito:
- la conoscenza dei principi fondamentali della statistica esplorativa, inferenziale e predittiva applicata all'analisi dei dati sulla sicurezza;
- la comprensione delle principali metodologie per la raccolta, l’organizzazione e l’analisi di dati provenienti da fonti ufficiali;
- la comprensione delle assunzioni, delle potenzialità e dei limiti degli strumenti statistici utilizzati.
Capacità di applicare conoscenza e comprensione
Al termine del corso, gli studenti e le studentesse saranno in grado di:
- acquisire, organizzare e gestire dataset provenienti da fonti ufficiali;
- utilizzare il software R e l’ambiente RStudio per la manipolazione e l'analisi dei dati;
- descrivere e sintetizzare i dati mediante indicatori statistici e rappresentazioni grafiche;
- applicare metodi inferenziali allo studio di fenomeni legati alla sicurezza;
- costruire e interpretare modelli di regressione e machine learning;
- utilizzare procedure appropriate per l'analisi di dati reali.
Autonomia di giudizio
Al termine del corso, gli studenti e le studentesse saranno capaci di:
- valutare criticamente la qualità e l'affidabilità dei dati sulla sicurezza;
- selezionare gli strumenti statistici più appropriati in funzione del problema;
- interpretare criticamente i risultati ottenuti.
Abilità comunicative
Al termine del corso, gli studenti e le studentesse saranno in grado di:
- presentare e comunicare i risultati delle analisi statistiche attraverso tabelle, grafici e indicatori sintetici;
- descrivere in modo chiaro le metodologie adottate e i risultati ottenuti utilizzando una terminologia statistica appropriata.
Capacità di apprendimento
Al termine del corso, gli studenti e le studentesse svilupperanno la capacità di:
- reperire, valutare e utilizzare criticamente nuovi dati relativi a fenomeni legati alla sicurezza;
- affrontare in autonomia nuovi problemi analitici applicando le conoscenze e le competenze acquisite durante il corso;
- aggiornare e sviluppare le proprie competenze nell'ambito dell'analisi dei dati.
Contenuti sintetici
Il corso si propone di trasmettere conoscenze e competenze fondamentali per l’analisi statistica per la sicurezza. L’approccio combina aspetti teorici e applicativi attraverso l’analisi di dati reali sulla sicurezza, con il supporto del software statistico R e dell’ambiente RStudio.
Il corso è organizzato in quattro macro-argomenti.
Il primo argomento introduce i concetti fondamentali della statistica applicata alla sicurezza, con particolare attenzione alle fonti dei dati (come ISTAT e Ministero della Giustizia), alla qualità dell’informazione statistica e alla struttura dei dati. Viene inoltre introdotto l’utilizzo di R per l’importazione e la gestione dei dati.
Il secondo argomento è dedicato all’analisi esplorativa dei dati e introduce concetti chiave come distribuzioni di frequenza, misure di sintesi, rappresentazioni grafiche e analisi delle relazioni tra variabili.
Il terzo argomento riguarda l’inferenza statistica e i principali strumenti di analisi probabilistica e inferenziale. Sono trattati variabili casuali, distribuzioni di probabilità, stima puntuale e intervallare, test d’ipotesi, confronto tra gruppi e analisi della varianza.
Il quarto argomento è dedicato all’analisi predittiva, con introduzione alla regressione lineare e logistica e ai principali metodi di machine learning.
Tutte le tecniche e gli strumenti presentati durante il corso sono implementati in R e RStudio, soffermandosi in particolare sull’interpretazione critica dei risultati ottenuti.
Programma esteso
Argomento 1 Cenni introduttivi alla statistica per la sicurezza e al software R
- Introduzione alla statistica per la sicurezza: obiettivi e strumenti
- Sicurezza oggettiva e soggettiva, fonti ufficiali di dati
- Popolazioni, campioni e unità statistiche
- Qualità del dato: errori e affidabilità delle misure
- Introduzione al software statistico R
Argomento 2 Analisi esplorativa
- Distribuzioni di frequenza
- Misure di tendenza centrale e dispersione
- Tabelle di contingenza
- Relazioni tra coppie di variabili
- Rappresentazioni grafiche
Argomento 3 Inferenza statistica
- Variabili casuali discrete e continue
- Distribuzioni di probabilità
- Stima puntuale e intervallare
- Test statistici univariati
- Test statistici a due campioni
- Confronto tra gruppi e analisi della varianza
Argomento 4 Analisi predittiva
- Regressione lineare semplice e multipla
- Regressione logistica
- Introduzione al machine learning
Prerequisiti
Competenze base di matematica e calcolo.
Metodi didattici
Il corso si compone di 56 ore svolte in presenza, prevalentemente in didattica erogativa (DE). Le lezioni combinano la presentazione dei concetti teorici mediante slide con pratiche svolte utilizzando R e RStudio.
Durante il corso sono previsti momenti di didattica interattiva (DI) finalizzati a favorire la partecipazione attiva degli studenti e delle studentesse attraverso l’applicazione in tempo reale delle procedure illustrate a lezione utilizzando i propri dispositivi personali. Le attività di didattica interattiva sono integrate nelle lezioni e consistono principalmente nello svolgimento guidato di esercitazioni in R, nella discussione dei risultati e nella risoluzione di problemi applicativi.
Gli studenti e le studentesse potranno inoltre replicare autonomamente le analisi presentate durante il corso utilizzando i codici messi a disposizione dal docente.
La piattaforma e-learning del corso (https://elearning.unimib.it) è regolarmente aggiornata con il materiale didattico, incluse le slide delle lezioni, i codici R, i dataset utilizzati e ulteriori risorse di approfondimento.
Modalità di verifica dell'apprendimento
La valutazione dell’apprendimento avviene mediante una prova scritta finalizzata ad accertare il raggiungimento degli obiettivi formativi.
La prova comprende domande a scelta multipla e domande aperte nelle quali viene richiesto di riportare i codici sviluppati in R utilizzati per l’individuazione della risposta corretta e di fornire un’interpretazione critica dei risultati ottenuti.
Ulteriori informazioni verranno fornite durante il corso e rese disponibili sulla pagina e-learning.
Criteri di valutazione:
- Completezza e correttezza delle conoscenze acquisite;
- Capacità di utilizzare R/RStudio per l’analisi di dati sulla sicurezza;
- Capacità di interpretare criticamente i risultati delle analisi statistiche;
- Capacità di applicare gli strumenti statistici appropriati alla soluzione di problemi specifici;
- Capacità di sintesi;
- Uso appropriato del linguaggio e della terminologia statistica.
Testi di riferimento
Slide delle lezioni, dispense e altro materiale didattico sarà reso disponibile sulla pagina e-learning e integrato durante il corso.
Testi di utile consultazione:
- F. Mecatti “Statistica di Base. Come, Quando e Perchè”. McGraw Hill, III Edizione 2022
- A. Wooditch, N.J. Johnson, R. Solymosi, J. Medina Ariza, S. Langton “A beginner's guide to statistics for criminology and criminal justice using R”. Springer International Publishing, 2021.
- D. Weisburd, D.B. Wilson, A. Wooditch, C. Britt “Advanced statistics in criminology and criminal justice”. Springer, 2021.
Sustainable Development Goals
Learning objectives
The course adopts a practical and application-oriented approach and aims to provide students with the fundamental knowledge and skills required for the statistical analysis of security-related data, from data acquisition to predictive analytics.
Knowledge and Understanding
Upon successful completion of the course, students will have acquired:
- knowledge of the fundamental principles of descriptive, inferential and predictive statistics applied to the analysis of security-related data;
- an understanding of the main methodologies for collecting, organizing and analyzing data from official sources;
- an understanding of the assumptions, strengths and limitations of the statistical methods and tools employed.
Applying Knowledge and Understanding
Upon successful completion of the course, students will be able to:
- acquire, organize and manage datasets obtained from official sources;
- use the R programming language and the RStudio environment for data manipulation and analysis;
- describe and summarize data through statistical indicators and graphical representations;
- apply inferential methods to the study of security-related phenomena;
- build and interpret regression models and machine learning models;
- apply appropriate statistical procedures to the analysis of real-world data.
Making Judgements
Upon successful completion of the course, students will be able to:
- critically assess the quality and reliability of security-related data;
- select the most appropriate statistical tools according to specific problems;
- critically interpret the results obtained from statistical analyses.
Communication Skills
Upon successful completion of the course, students will be able to:
- present and communicate the results of statistical analyses through tables, graphs and summary indicators;
- clearly describe the methodologies adopted and the results obtained using appropriate statistical terminology.
Learning Skills
Upon successful completion of the course, students will have developed the ability to:
- identify, evaluate and critically use new data related to security phenomena;
- independently address new analytical problems by applying the knowledge and skills acquired during the course;
- update and further develop their competencies in data analysis.
Contents
The course aims to provide students with the fundamental knowledge and skills required for statistical analysis in the field of security. The approach combines theoretical concepts and practical applications through the analysis of real-world security-related datasets, supported by the R statistical software and the RStudio environment.
The course is organized into four main topics.
The first topic introduces the fundamental concepts of statistics applied to security, with particular attention to data sources (such as ISTAT and the Italian Ministry of Justice), data quality and data structure. The use of R for data import and management is also introduced.
The second topic focuses on exploratory data analysis and covers key concepts such as frequency distributions, summary measures, graphical representations and the analysis of relationships between variables.
The third topic addresses statistical inference and the main tools of probabilistic and inferential analysis. Topics include random variables, probability distributions, point and interval estimation, hypothesis testing, group comparisons and analysis of variance.
The fourth topic is devoted to predictive analytics, introducing linear and logistic regression as well as the main machine learning methods.
All techniques and tools presented throughout the course are implemented using R and RStudio, with particular emphasis on the critical interpretation of analytical results.
Detailed program
Topic 1 Introduction to statistics for security and the R environment
- Introduction to statistics for security: objectives and tools
- Objective and subjective security; official data sources
- Populations, samples and statistical units
- Data quality: errors and accuracy
- Introduction to the R statistical software and the RStudio environment
Topic 2 Exploratory data analysis
- Frequency distributions
- Measures of central tendency and dispersion
- Contingency tables
- Relationships between pairs of variables
- Graphical representations
Topic 3 Statistical inference
- Discrete and continuous random variables
- Probability distributions
- Point and interval estimation
- One-sample statistical tests
- Two-sample statistical tests
- Group comparisons and analysis of variance (ANOVA)
Topic 4 Predictive analysis
- Simple and multiple linear regression
- Logistic regression
- Introduction to machine learning
Prerequisites
Basic knowledge of mathematics and numerical computation.
Teaching methods
The course consists of 56 hours of in-person teaching, delivered primarily through lecture-based (erogative) teaching (DE). Classes combine the presentation of theoretical concepts through slides with practical activities carried out using R and RStudio.
Interactive teaching (DI) is integrated into the lectures and is designed to encourage active student participation through the real-time application of the procedures presented during class using personal devices. Interactive teaching activities mainly consist of guided exercises in R, discussion of results, and the solution of practical analytical problems.
Students will also be able to independently replicate the analyses presented during the course using the code provided by the instructor.
The course e-learning platform (https://elearning.unimib.it) is regularly updated with teaching materials, including lecture slides, R scripts, datasets used during the course, and additional learning resources.
Assessment methods
Student learning is assessed through a written exam designed to verify the achievement of the course learning outcomes.
The exam consists of multiple-choice questions and open questions requiring students to report the R code used to identify the correct answer and to provide a critical interpretation of the results obtained.
Further information will be provided during the course and will be available on the course e-learning page.
Assessment will be based on the following criteria:
- completeness and accuracy of the knowledge acquired;
- ability to use R and RStudio for the analysis of security-related data;
- ability to critically interpret the results of statistical analyses;
- ability to apply appropriate statistical tools to the solution of specific problems;
- ability to synthesize information effectively;
- appropriate use of statistical language and terminology.
Textbooks and Reading Materials
Lecture slides, handouts, and additional teaching materials will be available on the course e-learning page.
Suggested references:
- Mecatti, F. (2022). Statistica di Base. Come, Quando e Perché (3rd ed.). McGraw Hill.
- Wooditch, A., Johnson, N. J., Solymosi, R., Medina Ariza, J., & Langton, S. (2021). A Beginner's Guide to Statistics for Criminology and Criminal Justice Using R. Springer International Publishing.
- Weisburd, D., Wilson, D. B., Wooditch, A., & Britt, C. (2021). Advanced Statistics in Criminology and Criminal Justice. Springer.
Sustainable Development Goals
Key information
Staff
-
Rosa Maria Di Biase