- Data Architecture
- Summary
Course Syllabus
Obiettivi
Il corso, erogato in lingua Italiana, intende fornire allo studente consocenza sul ciclo di vita del dato e sui sistemi di gestione di basi di dati nei sistemi informativi tradizionali, osservandone la evoluzione dai sistemi centralizzati verso i sistemi distribuiti e federati. Gli aspetti tecnologici affrontati permettono allo studente di orientarsi nelle attività di progettazione.
Gli aspetti di gestione vengon approfonditi nei temi di data governance, dove si approfndiscono le tematiche di integrazione dati, fusione dati e assessment di qualità dei dati.
Infine la consocenza si estende alle tecnologie di gestione per big data, in cui i problemi di scalabilità delle tecniche e di eterogeneità dei tipi di dati diventano più rilevanti rispetto ai sistemi tradizionali, con la adozione di basi di documenti, dati a grafo e linked open data.
Contenuti sintetici
Modelli dati non relazionali
architetture dei dbms centralizzati distribuiti
architetture di big data
data managmenet: integrazioni dati, qualità
Programma esteso
NoSQL models
-
Key value databases
-
Wide tables·
-
Document based
- Graph Databases
architetture dei DBMS
- Sistemi di basi di dati centralizzati
- Sistemi distribuiti
- Sistemi replicati
Big data architecture
Data managment
- data integration
- · qualità dei dati
Prerequisiti
E' utile una conoscenza delle tematiche dei modelli dei dati, relazionale e Entità Relazione, del linguaggio SQL e delle metodologie di progettazione di basi di dati
Modalità didattica
Lezioni in lingua italiana frontali ed esercizi, interventi di aziende
Esercizi di autovalutazione non influenzanti il voto potrano essere proposti
Materiale didattico
slide pubblicate sulla piattaforma elearning
Libro di testo adottato
Text book Next Generation Databases: NoSQL, NewSQL, and Big Data by Guy Harrison Publisher: Apress Release Date: January 2016 ISBN 9781484213292
Periodo di erogazione dell'insegnamento
secondo semestre
Modalità di verifica del profitto e valutazione
Prove scritta con domande a risposte aperte sui contenuti del corso, esercizi numerici eventualmente seguite da un orale a richiesta del docente
In alternativa Progetto su tecnologie presentate durante il corso da svolgere da soli o in gruppo
Orario di ricevimento
giovedì dalle 10 alle 11 edificio U14 stanza 2017 prof. Maurino si prega mandare una email in anticipo
Sustainable Development Goals
Aims
The course is provided in Italian.
First of all the concept of data life cycle and of data base management system is discussed in traditioal environements and information systems, and the so called ACID properties are examined,
The evolution of data base management systems from centralized architectures to distributed and federated architectures is examined in detail, providing also general concepts of data architecture design.
As to data governance, two relevant phases are examined in more depth, data linkage (also called object identification ) and fusion, and data quality assessment, that are experimented using tools.
The recent evolution of management systerms from "small data" to big data is investigated, with specific reference to the most important phenomena, related to the increase in the volume of data and the increase in the heterogeneity of data types, from relational data bases to document bases, linked open data and graph data.
Contents
NoSQL models
(de)centralized data architecture
big data architecture
data managmenet: data integration, quality
Detailed program
NoSQL models
-
Key value databases
-
Wide tables·
-
Document based
- Graph Databases
architetture dei DBMS
- Sistemi di basi di dati centralizzati
- Sistemi distribuiti
- Sistemi replicati
Big data architecture
Data managment
- data integration
- · qualità dei dati
Prerequisites
Knowledge on data models, relational model and Entity Relationship model, and database design methodologies is useful, but non mandatory
Teaching form
Lectures and exercises in Italian, company presentation
Self-assessment tests, that will not be considered for the final evaluation will be provided
Textbook and teaching resource
slides will be published on the Elearning platform
Text book
Next Generation Databases: NoSQL, NewSQL, and Big Data
by Guy Harrison Publisher: Apress
Release Date: January 2016
ISBN 9781484213292
Semester
second semester
Assessment method
Written examination related to the topics of the course and exercises. Teacher could ask and oral exam
Alternative assessment method: Project work, individual or in group related to the technologies shown during the course
Office hours
Thursday from 10 to 11 building U14 room 2017 prof Maurino please send an email message before
Sustainable Development Goals
Key information
Staff
-
Marco Cremaschi
-
Andrea Maurino