- Data Science Lab
- Summary
Course Syllabus
Obiettivi formativi
Rendere gli studenti in grado di affrontare l'impostazione, la conduzione e la gestione di progetti di data science ed estrazione di informazioni da sistemi complessi di dati.
Il corso si concentra in particolare sull'impostazione e conduzione di progetti di estrazione dell'informazione in ambiti "aperti", cioè in assenza di obiettivi analitici precisi, dove i flussi dati costituiscono la base per l'ideazione, il design e l'implementazione di nuovi servizi, richiedendo al "data scientist" capacità creative, abilità organizzativa e comunicativa e solidità metodologica.
Sono previste anche lezioni teoriche di approfondimento su algoritmi e metodologie per il trattamento di strutture dati di particolare interesse per la pratica della data science (es. dati temporali o dati parzialmente ordinati).
Contenuti sintetici
Il corso illustra e introduce alla tipologia di attività che il data scientist è chiamato a svolgere nel contesto attuale, affronta la tematica della natura e della gestione di progetti di data science in ambito socio-economico e aziendale e si concreta nell'assegnazione di progetti di elaborazione dei dati (presi da ambiti reali) e generazione di contenuti informativi, che gli studenti, suddivisi in gruppi, devono condurre a termine nel periodo del corso, con la supervisione del docente.
Programma esteso
Il corso si suddivide in due parti, Nella prima, più breve, si svolgeranno alcuni seminari per illustrare le caratteristiche tipiche dei progetti di data science nei contesti socio-economici e di business; nella seconda, più ampia, gli studenti verranno suddivisi in gruppi (di 3-4 unità), ai quali saranno assegnati progetti basati su dati reali, da sviluppare e completare durante il corso.
PARTE I
1. Il contesto tecnologico ed economico attuale: complessità dei processi socio-economici e nuove esigenza conoscitive e di servizi a valore aggiunto.
2. Complessità dei dati e nuove fonti: web, e-commerce, Internet of Things, Smartphone...
3. Processi basati sui dati in ambito aziendale: marketing, crm, operations...
4. Esempi di progetti di data science in ambiti aziendali e istituzionali.
5. Elementi di project management e caratteristiche/criticità dei progetti di data science: obiettivi, qualità dei dati, scelte tecnologiche.
6. Computabilità e limiti del machine learning.
7. Analisi di dati temporali.
8. Analisi di dati parzialmente ordinati.
PARTE IIIdentificazione e assegnazione di progetti di data science (i contenuti dei progetti saranno definiti durante il corso).
Prerequisiti
Non sono previsti prerequisiti formali, ma è necessaria una conoscenza delle tecniche di base della statistica inferenziale, dell'analisi multivariata e di data mining, nonché la conoscenza di base della programmazione R.
Metodi didattici
Lezioni frontali e supervisione periodica dei progetti di elaborazione dei dati.
Modalità di verifica dell'apprendimento
L'apprendimento verrà verificato attraverso:
1. Una valutazione progressiva del modo in cui gli studenti affronteranno le difficoltà nella conduzione dei progetti.
2. Valutazione del rapporto di progetto da parte dei docenti., in termini di originalità, competenza metodologica e qualità dell'esposizione.
Questa modalità di verifica dell'apprendimento è motivata dall'obiettivo di mettere gli studenti nelle condizioni operative tipiche dell'attività lavorativa e di farne in particolare emergere le abilità soft (organizzative, comunicative, creative...).
Testi di riferimento
Computers Ltd. What they really can't do, Harel D. Oxford University Press, 2000
Documenti e slide fornite dal docente, disponibili online.
Periodo di erogazione dell'insegnamento
II semestre
Lingua di insegnamento
English
Learning objectives
To make students capable to set and lead data science projects on complex data systems.
Particularly, the course focuses on projects addressing soft and "open" questions, where a precise specification of analytical goals lacks, differently from a "classical statistics setting" and where data sources are the basis for new services, whose design and implementation requires creativity, managerial and communicative skills as well as methodological competencies.
In addition, some lessons/workshops will be devoted to algorithms and methodologies for treating some data structures of particular interest in the data science practice (e.g. temporal data or partially ordered data).
Contents
The course illustrates and introduces to the kind of activities that a data scientist performs in socio-economic and business contexts and the topic of how to manage data science projects. In practice, these topics are addressed by means of concrete projects to be managed by groups of students, with the supervision of the teacher.
Detailed program
The course is divided into two parts. In the first some lessons, under the form of seminars, will be held to touch upon some specific basic topics, In the second part, students will be assigned projects to be managed and concluded within the course.
PART I
1. The current technological and economic context: complex socio-economic processes, the need for new knowledge and innovative services.
2. Data complexity and new data sources: web, e-commerce, Internet of Things, Smartphones...
3. Data.driven business processes: marketing, crm, operations...
4. Examples of data science projects.
5. Basics of Project Management: specificities and criticalities of data science projects, data quality and technological choices.
6. Computability and the limits of machine learning algorithms.
7. Analysis of temporal data.
8. Analysis of partially ordered data.
PARTE II
Definition and assignment of data science projects to student groups (each group is composed of 3-4 students; the content of the projects will be identified during the course) .
Prerequisites
There are no formal prerequisites but basic competencies in inferential statistics, data anaysis, data mining and R programming are necessary.
Teaching methods
Frontal lessons and project supervision.
Assessment methods
The competence level will be assessed by:
1. An ongoing evaluation of the way students face the management of the project and its difficulties.
2. Assessment of the project report, by the teachers, in terms of orginiality, methodological soundness and quality of the exposition.
This assessment method is motivated by the goal to put students into the setting of real business activities and to make their soft skills (e.g. organizational, communicative) and creativity emerge.
Textbooks and Reading Materials
Computers Ltd. What they really can't do, Harel D. Oxford University Press, 2000
Documents and slides provided by the teacher, available online
Semester
II semester
Teaching language
English
Key information
Staff
-
Marco Fattore
-
Silvio Gerli