Course Syllabus
Titolo
Data Management for Machine Learning
Docente(i)
Andrea Maurino
Blerina Spahiu
Lingua
Inglese
Breve descrizione
Il machine learning (ML) consente ai computer di interpretare i dati, comunicare in linguaggio naturale, rispondere a domande complesse e interagire con gli utenti e altre applicazioni. Oggi, l'ML non è solo un campo di ricerca molto stimolante, ma è anche uno degli strumenti più utilizzati in diverse aree di ricerca. In entrambi i casi, il machine learning si basa su attività di gestione dati ad alta elaborazione come comprensione dei dati, esplorazione dei dati, preparazione dei dati e pulizia dei dati. Questo corso coprirà le sfide della gestione dei dati, l'analisi dei dati, gli strumenti e i sistemi per la preparazione dei dati per una rapida implementazione di ML. Il corso affronterà problemi legati a (1) esplorazione e comprensione dei dati, (2) integrazione, pulizia e convalida dei dati e (3) preparazione dei dati per i modelli di machine learning. L'obiettivo di questo corso è fornire agli studenti una visione approfondita di un importante e emergente argomento nella ricerca sulla gestione dei dati e mostrare le tecnologie attuali in questo campo.
CFU / Ore
20 ore
Periodo di erogazione
Settembre 2023
Sustainable Development Goals
Title
Data Management for Machine Learning
Teacher(s)
Andrea Maurino
Blerina Spahiu
Language
English
Short description
Machine learning (ML) enables computers to interpret data, communicate in natural language, answer complex questions, and interact with users and other applications. Today, ML is not only a very stimulating research field, but it is also one of the most frequently used tools in different research areas. In both cases, Machine Learning relies on high-effort data management tasks such as data understanding, data exploration, data preparation and data cleaning. This course will cover data management challenges, data analytics, data wrangling tools and systems for faster ML deployment. The course will discuss problems related to (1) data exploration and understanding, (2) data integration, cleaning, and validation, and (3) data preparation for ML models. The goal of this course is to give students an in-depth look at an important, emerging topic in data management research as well as to show the current technologies in this field.
CFU / Hours
20 hours
Teaching period
September 2023