- Area Economico-Statistica
- Corso di Laurea Triennale
- Statistica e Gestione delle Informazioni [E4102B]
- Insegnamenti
- A.A. 2024-2025
- 3° anno
- Data Processing and Analysis
- Introduzione
Syllabus del corso
Obiettivi
Il corso intende fornire le competenze (metodologiche e tecnici) e gli strumenti per la comprensione e la realizzazione di soluzioni per il processamento di Big Data (strutturati e non), attraverso l'uso degli algoritmi e tool di AI per l'estrazione e rappresentazione della conoscenza da dati reali. Inoltre, il corso intende fornire gli strumenti tecnici per la modellazione e realizzazione di data model in accordo con il paradigma NoSQL, focalizzando principalmente sui graph-database e databaseNoSQL. Infine, si forniranno competenze tecniche e metodologiche relativamente ad algoritmi di explainable AI per la comprensione di algoritmi di machine learning black box
Contenuti sintetici
Introduction to AI and Big Data Analytics
Getting knowledge from data
Modelling and Querying the Resulting knowledge
Programma esteso
- Introduction to AI and Big Data Analytics
- Goal and rationale of AI. The relation between Big Data and AI
- The value of knowledge – digital economy and data-driven decision making
- Getting knowledge from data
- Word Embedding (Word2Vec, Doc2Vec,GLOVE, FastText, StarSpace)
- Evaluate word embedding models (intrinsic vs extrinsic evaluation)
- Topic Modelling through Python
- Modelling and Querying the Resulting knowledge through NoSQL 1. introduction to NoSQL data stores
2. graph-databases and graph-traversal query languages (Cypher)
3. Document Databases
- Explainable AI (global and local interpretation models)
- Introduction to XAI, local/global interpretation models. model agnostic-specific algorithms
- XAI techniques as in the state of the art (eg. LIME, SHAP, etc)
Prerequisiti
Nessuno
Modalità didattica
Lezioni frontali, seminari monotematici, esercitazioni, assegnamenti da svolgere a casa.
Materiale didattico
Lezioni con l'ausilio di slide, laboratorio e casi applicativi. Articoli scientifici di riferimento saranno forniti dal docente. Il Software utilizzato sarà open-source
Periodo di erogazione dell'insegnamento
III ciclo
Modalità di verifica del profitto e valutazione
La modalità di verifica si basa su una prova scritta ed una eventuale prova orale.
La prova scritta si svolge al computer ed è composta da domande aperte e chiuse e risposta multipla su tutti gli argomenti del corso.
In sede di valutazione viene considerata la capacità dello studente di rispondere a quesiti specifici facendo riferimento agli aspetti teorici e pratici (mediante esempi) connessi all'argomento richiesto.
La prova scritta è comune sia per gli studenti frequentanti sia per i non frequentanti.
La prova orale è mirata ad accertare la conoscenza teorica dello studente sugli argomenti del corso. Saranno quindi valutate le capacità di ragionare e approfondire le tematiche proposte in sede di esame e il rigore metodologico del loro sviluppo.
Orario di ricevimento
su Appuntamento
Aims
The course aims at providing skills (both methodological and technical) and tools for understanding and implementing solutions for Big Data processing (structured and unstructured data), through the use of AI algorithms and tools for the extraction and knowledge representation from real data. In addition, the course intends to provide the technical tools for modelling and realising data models following the NoSQL paradigm, focusing mainly on the graph-database and NoSQL database. Finally, competencies related to XAI will be provided to explain the behaviour of black box algorithms
Contents
Introduction to AI and Big Data Analytics
Getting knowledge from data
Modelling and Querying the Resulting knowledge
Detailed program
- Introduction to AI and Big Data Analytics
- Goal and rationale of AI. The relation between Big Data and AI
- The value of knowledge – digital economy and data-driven decision making
- Getting knowledge from data
- Word Embedding (Word2Vec, Doc2Vec,GLOVE, FastText, StarSpace)
- Evaluate word embedding models (intrinsic vs extrinsic evaluation)
- Topic Modelling through Python
- Modelling and Querying the Resulting knowledge through NoSQL 1. introduction to NoSQL data stores
2. graph-databases and graph-traversal query languages (Cypher)
3. Document Databases
- Explainable AI (global and local interpretation models)
- Introduction to XAI, local/global interpretation models. model agnostic-specific algorithms
- XAI techniques as in the state of the art (eg. LIME, SHAP, etc)
Prerequisites
None
Teaching form
The course will be provided by means of lessons, seminars, and laboratory sessions and homeworks.
Textbook and teaching resource
Lectures with the support of slides, laboratory and real-life case studies. Scientific Papers and books indicated by the lecturer. The software used is either available as open source or through academic license
Semester
III ciclo
Assessment method
The verification method is based on a written test whilst the oral examination will be provided on request.
The written test takes place at the computer and it consists of open and closed questions with multiple answers on all course topics.
The evaluation is focused on the student's ability to answer to specific questions by referring both to the theoretical and practical aspects (through examples) connected to the requested topic.
The written test is common for both attending students and non-attending students.
The oral exam is aimed at assessing the theoretical knowledge of the student on the topics of the course. The ability to reason and deepen the issues proposed during the examination and the methodological rigor of their development will be evaluated.
Office hours
By Appointment