Syllabus del corso
Obiettivi formativi
Il corso si propone l'obiettivo di introdurre all'utilizzo avanzato di applicazioni data-intensive basate su principi di DataOps, che comprendono principi di orchestrazione di risorse e componenti applicative, infrastrutture software distribuite di tipo cloud hybrid e l'utilizzo di infrastructure code.
Contenuti sintetici
In particolare il corso coprirà i seguenti contenuti:
1. Introduzione all'utilizzo di DataOps, Data Wharehousing, e principi di Data Quality;
2. Introduzione all'utilizzo di containers e loro orchestrazione;
3. Introduzione all'utilizzo di Serverless computing per data-intensive applications, mediante la suite RADON e altre implementazioni open-source;
4. Introduzione all'utilizzo di approcci MLOps pratici, esemplificate dalla suite DataRobot;
Prerequisiti
- Fondamenti di python programming e utilizzo di framework big data (e.g., Apache Spark, Cassandra);
- Fondamenti di architetture software distribuite e loro requirements engineering & design;
Metodi didattici
Il corso si articolerà in lezioni frontali, self-study, invited seminars e interactive sessions.
Modalità di verifica dell'apprendimento
Una sessione pratica di tipo hands-on su una suite nota di tipo MLOps verrà usata per far applicare concretamente i contenuti appresi.
Testi di riferimento
Nessuno (articoli e materiale fornito dal docente).
Periodo di erogazione dell’insegnamento
March 1st - March 4th (virtual).
Lingua di insegnamento
Italian/English.
Sustainable Development Goals
Learning objectives
The course aims to introduce the advanced use of data-intensive applications based on DataOps principles, which include principles of orchestration of resources and application components, distributed cloud hybrid software infrastructures and the use of infrastructure code.
Contents
In particular, the course will cover the following technical contents:
1. Introduction to the use of DataOps, Data Wharehousing, and Data Quality principles;
2. Introduction to the use of containers and their orchestration;
3.
Introduction to the use of Serverless computing for data-intensive
applications, through the RADON suite and other open-source
implementations;
4. Introduction to the use of practical MLOps approaches, exemplified by the DataRobot suite;
Prerequisites
- Fundamentals of python programming and use of big data frameworks (e.g., Apache Spark, Cassandra);
- Fundamentals of distributed software architectures and their requirements engineering & design;
Teaching methods
The course will be divided into lectures, self-study, invited seminars and interactive sessions.
Assessment methods
A practical hands-on session on a known MLOps-type suite will be used to concretely apply the learned contents.
Textbooks and Reading Materials
None (articles and material provided by the teacher).