- Architetture Dati
- Introduzione
Syllabus del corso
Obiettivi
Il corso, erogato in lingua Italiana, intende fornire allo studente consocenza sul ciclo di vita del dato e sui sistemi di gestione di basi di dati nei sistemi informativi tradizionali, osservandone la evoluzione dai sistemi centralizzati verso i sistemi distribuiti e federati. Gli aspetti tecnologici affrontati permettono allo studente di orientarsi nelle attività di progettazione.
Gli aspetti di gestione vengon approfonditi nei temi di data governance, dove si approfndiscono le tematiche di integrazione dati, fusione dati e assessment di qualità dei dati.
Infine la consocenza si estende alle tecnologie di gestione per big data, in cui i problemi di scalabilità delle tecniche e di eterogeneità dei tipi di dati diventano più rilevanti rispetto ai sistemi tradizionali, con la adozione di basi di documenti, dati a grafo e linked open data.
Contenuti sintetici
La gestione dei dati nei sistemi di gestione tradizionali
Evoluzione dei sistemi di gestione da centralizzati a distribuiti e replicati
Data governance
NoSQL database, modelli e architetture
Big data architetture
Programma esteso
Sistemi di basi di dati tradizionali
· Sistemi di basi di dati centralizzati
· Sistemi distribuiti
· Sistemi replicati
· Sistemi federati
· Sistemi di data Warehouse (cenni)
· Sistemi di Data integration (cenni)
La data governance
· Il record linkage
·
La qualità dei dati
Evoluzione delle basi di dati verso i big data
· Architetture e modelli NoSQL
· Key value databases
· Document based DBMSs
· Graph Databases
· Linked Open Data
· Big Data
Prerequisiti
E' utile una conoscenza delle tematiche dei modelli dei dati, relazionale e Entità Relazione, del linguaggio SQL e delle metodologie di progettazione di basi di dati
Modalità didattica
Lezioni in lingua italiana frontali ed esercizi, interventi di aziende
Esercizi di autovalutazione non influenzanti il voto potrano essere proposti
Materiale didattico
slide pubblicate sulla piattaforma elearning
Libro di testo adottato
Text book Next Generation Databases: NoSQL, NewSQL, and Big Data by Guy Harrison Publisher: Apress Release Date: January 2016 ISBN 9781484213292
Periodo di erogazione dell'insegnamento
secondo semestre
Modalità di verifica del profitto e valutazione
Prove scritta con domande a risposte aperte sui contenuti del corso, esercizi numerici eventualmente seguite da un orale a richiesta del docente
In alternativa Progetto su tecnologie presentate durante il corso da svolgere da soli o in gruppo
Orario di ricevimento
giovedì dalle 10 alle 11 edificio U14 stanza 2017 prof. Maurino si prega mandare una email in anticipo
Aims
The course is provided in Italian.
First of all the concept of data life cycle and of data base management system is discussed in traditioal environements and information systems, and the so called ACID properties are examined,
The evolution of data base management systems from centralized architectures to distributed and federated architectures is examined in detail, providing also general concepts of data architecture design.
As to data governance, two relevant phases are examined in more depth, data linkage (also called object identification ) and fusion, and data quality assessment, that are experimented using tools.
The recent evolution of management systerms from "small data" to big data is investigated, with specific reference to the most important phenomena, related to the increase in the volume of data and the increase in the heterogeneity of data types, from relational data bases to document bases, linked open data and graph data.
Contents
Data life cycle, management and analysis phases
Traditiona Data Base Management systems (DBMS)
Evolution of DBMSs from centralized to distributed, replicated, federated.
Data governance
NoSQL database models and architetture
Big data principles and architectures
Detailed program
Traditional Data Base Management Systems (DBMS)
· Centralized data base management systems (DBMS)
· Distributed DBMSs
· Replicated systems
·
Data
warehouses
· Virtual data integration systems
Data governance
· Record linkage and fusion
·
Data
Quality
Evolution of data management systems from small data to big data
· NoSql Architectures and models
· Key value databases
· Document based DBMSs
· Graph Databases
· Linked Open Data
· Big Data
Prerequisites
Knowledge on data models, relational model and Entity Relationship model, and database design methodologies is useful, but non mandatory
Teaching form
Lectures and exercises in Italian, company presentation
Self-assessment tests, that will not be considered for the final evaluation will be provided
Textbook and teaching resource
slides will be published on the Elearning platform
Text book
Next Generation Databases: NoSQL, NewSQL, and Big Data
by Guy Harrison Publisher: Apress
Release Date: January 2016
ISBN 9781484213292
Semester
second semester
Assessment method
Written examination related to the topics of the course and exercises. Teacher could ask and oral exam
Alternative assessment method: Project work, individual or in group related to the technologies shown during the course
Office hours
Thursday from 10 to 11 building U14 room 2017 prof Maurino please send an email message before
Scheda del corso
Staff
-
Marco Cremaschi
-
Andrea Maurino