- Big Data in Economics
- Summary
Course Syllabus
Obiettivi formativi
Il corso si propone di sviluppare le competenze per applicare l'analisi dei dati ai problemi economici ed aziendali. In modo specifico analizza con "case study" e dataset tre problemi fondamentali di ricerca: effetti causali, previsione e classificazione non supervisionata.
In generale gli obiettivi formativi ricardono nelle aree di data science, informatica e statistica legate alle imprese.
Contenuti sintetici
Il corso è diviso in 4 parti.
Nella prima parte si discute il ruolo dei big data all'interno dell'economia e le nuove sfide da essi generato. Le restanti tre parti del corso discutono sepratamente le tre aree di applicazione (causalità, previsione e classificazione non supervisionata) con esempi concreti riguardanti in modo particolari le funzioni di gestione dei rischi e scelte del consumatore.
Infine saranno organizzati laboratori di utilizzo di algoritmi con il software R.
Programma esteso
1. Introduzione e definizione del problema: the Big Data Challenge
2. Il ruolo dell'incertezza: Causa, previsione e classificazione non supervisionata.
3. Meccanismi causali: elementi fondamentali e un case study.
4. Previsione: la sfida di valutare l'incertezza nei modelli predittivi.
5. Apprendimento non supervisionato: Self-Organizing-Map e marketing
6. Bonus track: l'analisi del Drift nei modelli aziendali.
7. Reporting dei risultati in impresa: creare una narrativa intorno ai modelli.
Prerequisiti
Principi di programmazione in R o pyhton. Statistica di base
Metodi didattici
Il corso di 21 ore è composta da
11 ore di lezioni laboraratorio in remoto modalità sincrona.
10 ore di lezioni in presenza con modalità erogativa.
Modalità di verifica dell'apprendimento
Esame scritto e progetto di analisi dati (50%-50%) . Entrambi verteranno sugli argomenti del corso. Durante l'esame sarà valutata la correttezza e la chiarezza delle risposte.
Testi di riferimento
Il materiale didattico è costituito da alcuni capitoli di libro e da una serie di articoli su rivista scientifica e dai lucidi delle lezioni. Il materiale didattico sarà disponibile in forma elettronica sulla piattaforma di e-learning. Quando questo non è possibile una copia cartacea degli articoli sarà resa disponibile all'inizio del corso.
libro:
Data Science for Business
What You Need to Know about Data Mining and Data-Analytic Thinking
By Foster Provost, Tom Fawcett
Periodo di erogazione dell'insegnamento
II semestre
Lingua di insegnamento
Inglese
Sustainable Development Goals
Learning objectives
The course aims to develop the skills to apply data analysis to economic and business problems.
Specifically, it analyzes with case studies and datasets three fundamental problems: causal effects, prediction, and unsupervised classification.
In general, the educational objectives fall within the areas of data science, computer science, and statistics related to businesses.
Contents
The course is divided into 4 parts.
The first part discusses the role of big data within within the firm and the new challenges. The remaining three parts of the course separately discuss the three main areas of application (causality, prediction and unsupervised classification) with specific examples mainly concerning risk management and consumer choices.
Finally, in hands-on lab students learn to develop R algorithm for data analysis.
Detailed program
1. Introduction and definition of the problem: the Big Data Challenge
2. The role of uncertainty: Cause, prediction and unsupervised classification.
3. Causal mechanisms: fundamental elements and a case study.
4. Prediction: the challenge of assessing uncertainty in predictive models.
5. Unsupervised learning: Self-Organizing-Map and marketing
6. Bonus track: the analysis of drift in business models.
7. Reporting of company results: creating a narrative around the model
Prerequisites
Principles of programming in R or Python. Basic statistics.
Teaching methods
The 21-hour course consists of:
11 hours of remote synchronous laboratory sessions.
10 hours of in-person lecturing sessions.
Assessment methods
Project and written exam about the course content (50%-50%) . The assessment depends on the correctness and the clarity of the answers.
Textbooks and Reading Materials
The reading material is based on journal articles and selected book chapters. The material will be available on the e-learning platform.
Book
Data Science for Business
What You Need to Know about Data Mining and Data-Analytic Thinking
By Foster Provost, Tom Fawcett
Semester
II semester
Teaching language
English