Skip to main content
If you continue browsing this website, you agree to our policies:
  • Condizioni di utilizzo e trattamento dei dati
Continue
x
If you continue browsing this website, you agree to our policies:
  • Condizioni di utilizzo e trattamento dei dati
Continue
x
e-Learning - UNIMIB
  • Home
  • More
Listen to this page using ReadSpeaker
 Log in
e-Learning - UNIMIB
Home
Percorso della pagina
  1. Science
  2. Master Degree
  3. Data Science [FDS02Q - FDS01Q]
  4. Courses
  5. A.A. 2024-2025
  6. 1st year
  1. Data Management
  2. Summary
Unità didattica Course full name
Data Management
Course ID number
2425-1-FDS01Q001-FDS01Q001M
Course summary SYLLABUS

Blocks

Back to Data Management and Visualization

Course Syllabus

  • Italiano ‎(it)‎
  • English ‎(en)‎
Export

Obiettivi

Alla fine del modulo gli studenti saranno in grado di definire e realizzare una pipeline di dati completa dall'acquisizione dei dati all'archiviazione dei dati (relazionale o meno) in base alle loro esigenze applicative

Gli studenti saranno in grado di valutare per ogni fase lo strumento appropriato da utilizzare

Contenuti sintetici

Introduzione alla gestione dei dati nel contesto dei big data

ciclo di vita dei dati
tecniche di acquisizione dati
modellazione e archiviazione dei dati
preparazione dei dati, pulizia, qualità e analisi esplorativa dei dati
concetti avanzati di gestione dei dati

Programma esteso

  1. Data life cycle
  2. data acquisition
  3. web scraping
  4. rest api
  5. real time data acquisition
  6. use of LLM
  7. data storage and modelling
  8. Introduction to NoSQL models
  9. key value and columnar models
  10. Document based system
  11. Graph db
    6.data preparation, cleansing, quality and explorative data analysis
  12. Data integration
  13. Data quality
  14. Advanced data management concepts
  15. data warehouse
  16. data lake

Prerequisiti

conoscenza del modello relazionale dei dati, linguaggio SQL, almeno un lingguaggio di programmazione

Modalità didattica

le ore del corso sono 46 cosi organizzate
28 ore di lezione
18 ore di laboratorio

tutte le ore saranno erogate in presenza ein modalità interattiva

Materiale didattico

G. Harrison Next Generation Databases, Apress, 2015

A. Rezzani Big data analytics Apogeo 2017

Yau, N. (2011). Visualize this: the FlowingData guide to design, visualization, and statistics. John Wiley & Sons.

Ware, C. (2012). Information visualization: perception for design. Elsevier.

Scientific articles and class pack provided by the lecturers.

Periodo di erogazione dell'insegnamento

Primo semestre

Modalità di verifica del profitto e valutazione

L'esame è diviso in due parti

Data management (50% della valutazione finale): Esame scritto con domande aperte e discussione su un progetto di integrazione e analisi di almeno due sorgenti dati diverse acquisite con almeno una delle tecniche di acquisizione dati viste a lezioni. il progetto può esse svolto in gruppi di 2-3 persone

Visualizzazione dei dati (50% della valutazione finale): test e un progetto correlato all'argomento del modulo

Orario di ricevimento

Please send an e-mail to teachers to arrange an appointment

Sustainable Development Goals

ISTRUZIONE DI QUALITÁ | IMPRESE, INNOVAZIONE E INFRASTRUTTURE
Export

Aims

At the end of the module students will be able to define and implement a complete data pipeline from data acquisition to data storage (relational or not) based on their application needs

Students will be able to evaluate for each phase the appropriate tool to use

Contents

Introduction to data management in big data context

data life cycle
data acquisition techniques
data modelling and storage
data preparation, cleansing, quality and explorative data analysis
advance data management concepts

Detailed program

  1. Data life cycle
  2. data acquisition
  3. web scraping
  4. rest api
  5. real time data acquisition
  6. use of LLM
  7. data storage and modelling
  8. Introduction to NoSQL models
  9. key value and columnar models
  10. Document based system
  11. Graph db
    6.data preparation, cleansing, quality and explorative data analysis
  12. Data integration
  13. Data quality
  14. Advanced data management concepts
  15. data warehouse
  16. data lake

Prerequisites

knowledge of the relational data model, SQL language, at least one programming language

Teaching form

the course hours are 46 organized as follows
28 hours of lessons
18 hours of laboratory

all hours will be delivered in presence and in interactive mode

Textbook and teaching resource

G. Harrison Next Generation Databases, Apress, 2015

A. Rezzani Big data analytics Apogeo 2017

Yau, N. (2011). Visualize this: the FlowingData guide to design, visualization, and statistics. John Wiley & Sons.

Ware, C. (2012). Information visualization: perception for design. Elsevier.

Scientific articles and class pack provided by the lecturers.

Semester

first semester

Assessment method

The exam is divided into two parts

Data management (50% of the final evaluation): Written exam with open questions and discussion on an integration and analysis project of at least two different data sources acquired with at least one of the data acquisition techniques seen in the lessons. the project can be carried out in groups of 2-3 people

Data visualization (50% of the final assessment): tests and a project related to the module topic

Office hours

Please send an e-mail to teachers to arrange an appointment

Sustainable Development Goals

QUALITY EDUCATION | INDUSTRY, INNOVATION AND INFRASTRUCTURE
Enter

Key information

Field of research
INF/01
ECTS
6
Term
First semester
Activity type
Mandatory
Course Length (Hours)
46
Degree Course Type
2-year Master Degreee
Language
English

Staff

    Teacher

  • AM
    Andrea Maurino
  • Daniele Maria Papetti
    Daniele Maria Papetti

Enrolment methods

Self enrolment (Student)
Manual enrolments

Sustainable Development Goals

QUALITY EDUCATION - Ensure inclusive and equitable quality education and promote lifelong learning opportunities for all
QUALITY EDUCATION
INDUSTRY, INNOVATION AND INFRASTRUCTURE - Build resilient infrastructure, promote inclusive and sustainable industrialization and foster innovation
INDUSTRY, INNOVATION AND INFRASTRUCTURE

You are not logged in. (Log in)
Policies
Get the mobile app
Powered by Moodle
© 2025 Università degli Studi di Milano-Bicocca
  • Privacy policy
  • Accessibility
  • Statistics