- Area Economico-Statistica
- Corso di Laurea Triennale
- Statistica e Gestione delle Informazioni [E4102B]
- Insegnamenti
- A.A. 2019-2020
- 3° anno
- Complex Data Analysis
- Introduzione
Syllabus del corso
Obiettivi formativi
Rendere gli studenti in grado di affrontare l'impostazione, la conduzione e la gestione di progetti di data science ed estrazione di informazioni da sistemi complessi di dati, integrando le proprie competenza tecniche con elementi di project management e di comunicazione.
Il corso si concentra in particolare sull'impostazione e conduzione di progetti di estrazione dell'informazione in ambiti "aperti", cioè in assenza di obiettivi analitici precisi, come nella pratica statistica "classica", ponendosi nelle condizioni tipiche dei contesti attuali (sia in ambito aziendale che istituzionale), dove i flussi dati costituiscono la base per l'ideazione, il design e l'implementazione di nuovi servizi, richiedendo al "data scientist" capacità creative, abilità organizzativa e comunicativa e solidità metodologica.
Conoscenza e comprensione
In sintesi, il corso mira a trasferire conoscenza e a far comprendere le logiche di impostazione, sviluppo e conduzione di progetti di data science.
Capacità di applicare conoscenza e comprensione
Attraverso lo sviluppo di progetti concreti, l'insegnamento permette l'acquisizione di solide basi esperienziali per le applicazioni in tutti i campi della data science, compresi quello demografico, socio-economico, biostatistico e, in generale, in tutti gli ambiti in cui devono essere analizzati sistemi complessi e multidimensionali di dati.
Contenuti sintetici
Il corso illustra la tipologia di attività che il data scientist è chiamato a svolgere nel contesto attuale, affronta la tematica della natura e della gestione di progetti di data science in ambito aziendale e istituzionale e si concreta nell'assegnazione di progetti di elaborazione dei dati (presi da ambiti reali) e generazione di contenuti informativi, che gli studenti, suddivisi in gruppi, devono condurre a termine nel periodo del corso, con la supervisione del docente.
Programma esteso
Il corso si suddivide in due parti logiche distinte. Nella prima, si effettueranno alcune attività "seminariali" di focalizzazione dei concetti base. Nella seconda, si assegneranno agli studenti i progetti che dovranno essere svolti nell'ambito del corso, con la supervisione del docente.
PARTE I
- La data science: affinità e differenze con la statistica "classica".
- Il contesto tecnologico ed economico attuale: complessità dei processi socio-economici e nuove esigenza conoscitive e di servizi a valore aggiunto.
- Complessità dei dati e nuove fonti: web, e-commerce, Internet of Things, Smartphone...
- Esempi di progetti di data science
- Elementi di project management e caratteristiche/criticità dei progetti di data science: obiettivi, qualità dei dati, scelte tecnologiche.
PARTE II
Assegnazione dei progetti, impostazione delle modalità operative di conduzione delle attività e supervisione da parte del docente.
Prerequisiti
Non sono previsti prerequisiti formali, ma è necessaria una conoscenza delle tecniche di base della statistica inferenziale, dell'analisi multivariata e di data mining, nonché la conoscenza di base della programmazione R.
Metodi didattici
Lezioni frontali e supervisione periodica dei progetti di elaborazione dei dati, per verificare sia la qualità delle metodologie statistiche applicate, che la capacità di impostazione, di conduzione e di presentazione del progetto e dei suoi risultati.
Modalità di verifica dell'apprendimento
L'apprendimento verrà verificato attraverso:
- Una valutazione progressiva del modo in cui gli studenti affronteranno le difficoltà nella conduzione dei progetti.
- Una presentazione orale del lavoro ai docenti, con discussione critica
Questa modalità di verifica dell'apprendimento è motivata dall'obiettivo di mettere gli studenti nelle condizioni operative tipiche dell'attività lavorativa e di farne in particolare emergere le abilità soft (organizzative, comunicative, creative...).
Non sono previste modalità alternative di esame per i non frequentanti, né prove in itinere.
Testi di riferimento
Computers Ltd. What they really can't do, Harel D. OxfordUniversity Press, 2000
Documenti e slide fornite dal docente.
Risorse web e TED Talks
Periodo di erogazione dell’insegnamento
II semestre IV ciclo
Lingua di insegnamento
Italiano
Learning objectives
To make students capable to set and lead data science projects on complex data systems, integrating their statistical competencies with skills on project management and communication.
Particularly, the course focuses on projects addressing soft and "open" questions, where a precise specification of analytical goals lacks, differently from a "classical statistics setting", but more similarly to current business and institutional contexts. There, in fact, new data sources are the basis for new services, whose design and implementation requires creativity, managerial and communicative skills as well as methodological competencies.
Knowledge and comprehension
The course aims at transferring know-how pertaining to the logic behind the design the development and the management of data science projects.
Capability to apply knowledge and comprehension
By means of real projects, the course provides sound bases for applications to all of data science fields and also to socio-economic statistics, biostatistics and all of other domains where complex data are to be treated.
Contents
The course illustrates the kind of activities that a data scientist performs in real organizations and the topic of how to manage data science projects. In practice, these topics are addressed by means of concrete projects to be managed by groups of stdents, with the supervision of the teacher.
Detailed program
The course is divided into two parts. In the first some lessons, under the form of seminars, will be held to touch upon some specific basic topics, In the second part, students will be assigned projects to be managed and concluded within the course.
PART I
- Data science: similarities and differences with respect to "classical statistics"
- The current technological and economic context: complex socio-economic processes, the need for new knowledge and innovative services.
- Data complexity and new data sources: web, e-commerce, Internet of Things, Smartphones...
- Examples of data scienceprojects.
- Basics of Project Management: specificities and criticalities of data science projects, data quality and technological choices.
PART II
Assignment of projects to students, setting of the project management activities and supervision by the teacher.
Prerequisites
There are no formal prerequisites but but basic competencies in inferential statistics, data anaysis, data mining and R programming are necessary
Teaching methods
Frontal lessons and project supervsion, so as to verify the quality of the applied statistical methodologies and the capability to design, manage and present the project and its results.
Assessment methods
The competence level will be assessed by:
- An ongoing evaluation of the way students face the management of the project and its difficulties.
- A final oral presentation of the project and its result, with a critical discussion.
This assessment method is motivated by the goal to put students into the setting of real business activities and to make their soft skills (e.g. organizational, communicative) and creativity emerge.
There are neither special exams for students not attending the course, nor partial exams.
Textbooks and Reading Materials
Computers Ltd. What they really can't do, Harel D. OxfordUniversity Press, 2000
Documents and slides provided by the teacher
Web resources and TED Talks
Semester
II semester IV cycle
Teaching language
Italian
Scheda del corso
Staff
-
Marco Fattore
-
Silvio Gerli