- Area Economico-Statistica
- Corso di Laurea Magistrale
- Scienze Statistiche ed Economiche [F8204B]
- Insegnamenti
- A.A. 2024-2025
- 2° anno
- Economics for Data Science M
- Introduzione
Syllabus del corso
Obiettivi formativi
L'ubiquità delle grandi moli di dati e i contestuali sviluppi nella capacità computazionale e negli algoritimi creano nuove opportunità in ambito economico e aziendale.
Il corso si propone di sviluppare le competenze per applicare l'analisi dei dati a nuovi problemi economici ed aziendali. In modo specifico analizza con "case study" e dataset tre problemi fondamentali di ricerca: effetti causali, previsione e classificazione non supervisionata.
Alla fine del corso lo studente sarà in grado di trasformare un problema economico e aziendale in un modello, scegliere quale approccio empirico sia il più corretto e presentare i risultati dell'analisi in modo professionale.
In generale gli obiettivi formativi ricardono nelle aree di statistica economica ed econometria legate alle imprese.
Contenuti sintetici
Il corso è diviso in 5 parti.
Nella prima parte si discute il ruolo dei big data all'interno dell'economia e le nuove sfide da essi generato. Le tre parti seguenti discutono sepratamente le tre aree di applicazione (causalità, previsione e classificazione non supervisionata) con esempi concreti riguardanti in modo particolari le funzioni di gestione dei rischi e scelte del consumatore.
La quinta parte si concentra su come generare la reportistica dei vari tipi di analisi in ambito economico-aziendale con un'attenzione particolare alla creazione della narrativa di accompagnamento ai diversi modelli e alla loro visualizzazione.
Infine saranno organizzati laboratori di applicazione di algoritmi con il software R.
Programma esteso
1. Introduzione e definizione del problema: the Big Data Challenge
2. Il ruolo dell'incertezza: modelli causali, previsione e classificazione non supervisionata.
3. Modelli causali: elementi fondamentali e un case study.
4. Modelli causali: case studies e laboratorio
5. Previsione: la sfida di valutare l'incertezza nei modelli predittivi.
6. Previsione: case studies e laboratorio
7. Apprendimento non supervisionato:
8. Apprendimento non supervisionato: case studies e laboratorio.
9. Tema di approfondimento I: la network analisi in impresa.
10. Network analisis in impresa: case studies for HR e marketing
11. Tema di approfodimento II: la sfida dei dati non strtutturati.
12. Dati non strutturati: case studies con dati testuali.
13. Dal dato alla conoscenza: il processo di data reporting in ambito economico.
14. Dal dato alla conoscenza: spunti di visualizzazione dei dati.
Prerequisiti
Principi di econometria applicata e metodi quantitativi di statistica applicata.
Metodi didattici
Il corso di 42 ore è composta da
12 ore di lezioni laboraratorio in remoto modalità sincrona.
12 ore di lezioni in presenza con modalità interattiva (presentazioni e dibattiti).
18 ore di lezioni in presenza con modalità erogativa.
Modalità di verifica dell'apprendimento
Studenti frequentanti: progetto ed esame scritto.
Studenti non frequentanti: progetto ed esame scritto.
Durante l'esame sarà valutata la correttezza e la chiarezza delle risposte e mira a valutare le competenze descritte negli obiettivi formativi
L'esame scritto consta di 4 domande a risposa aperta. Ilprogetto consiste nel rispondere a domanda di economia o business sull abase di un dataset fornito dal docente.
Testi di riferimento
Il materiale didattico è costituito da alcuni capitoli di libro e da una serie di articoli su rivista scientifica e dai lucidi delle lezioni. Il materiale didattico sarà disponibile in forma elettronica sulla piattaforma di e-learning. Quando questo non è possibile una copia cartacea degli articoli sarà resa disponibile all'inizio del corso.
libro:
Data Science for Business
What You Need to Know about Data Mining and Data-Analytic Thinking
By Foster Provost, Tom Fawcett
Periodo di erogazione dell'insegnamento
II semestre
Lingua di insegnamento
Inglese
Sustainable Development Goals
Learning objectives
The ubiquity of large amounts of data and the contextual developments in computational capacity and algorithms create new opportunities in the economic and corporate spheres.The course aims to develop the skills to apply data analysis to economic and business problems.
Specifically, it analyzes with case studies and datasets three fundamental problems: causal effects, prediction, and unsupervised classification.
At the end of the course the student will be able to transform an economic and business problem into a model, choose which empirical approach is the most correct and present the results of the analysis in a professional way.
In general, the educational objectives fall within the areas of economic statistics and econometrics related to businesses.
Contents
The course is divided into 5 parts.
The first part discusses the role of big data within within the firm and the new challenges. The subsequent three parts separately discuss three main areas of application (causality, prediction and unsupervised classification) with specific examples mainly about risk management and consumer choices.
The fifth part focuses on how to generate the reports for the various types of analysis in the economic-business context with particular attention to the creation of the narrative accompanying the different models and their visualization.
Finally, in hands-on lab students learn to develop algorithm for data analysis with the software R.
Detailed program
1. Introduction and definition of the problem: the Big Data Challenge
2. The role of uncertainty: Cause, prediction and unsupervised classification.
3. Causal models: fundamental elements and a case study.
4. Causal Models: case studies and laboratory
5. Prediction: the challenge of assessing uncertainty in predictive models.
6. Prediction: case studies and R lab
7. Unsupervised learning
8. Unsupervised learning: case studies and R lab
9. Hot topic I: network analysis for business.
10. Network analysis for business: case studies for HR and marketing
11. Hot topic II: the challenge of unstructured data.
12. Unstructured data: case studies with textual data.
13. From data to knowledge: the data reporting process in economics and business.
14. From data to knowledge: basic principles of data visualization.
Prerequisites
Principles of applied econometrics and statistical quantitative methods for data analysis.
Teaching methods
The course consists of 42 hours:
12 hours of remote synchronous laboratory sessions.
12 hours of in-person interactive sessions (student presenations and debates).
18 hours of in-person lecturing sessions.
Assessment methods
Attending students: project and written exam.
Non-attending students: project and written exam.
The assessment depends on the correctness and the clarity of the answers.
The written exam consists of 4 open-ended questions. The project involves answering a question on economics or business based on a dataset provided by the teacher.
Concerning the evaluation, the correctness and clarity of the answers will be assessed, aiming to evaluate the skills described in the learning objectives.
Textbooks and Reading Materials
The reading material is based on journal articles and selected book chapters. The material will be available on the e-learning platform.
Book
Data Science for Business
What You Need to Know about Data Mining and Data-Analytic Thinking
By Foster Provost, Tom Fawcett
Semester
II semester
Teaching language
English