Arricchire i Dati per Migliorare l’IA: Come Combinare Grafi di Conoscenza e Apprendimento Automatico

Matteo Palmonari

Inglese

Le applicazioni di Intelligenza Artificiale (AI) si basano in larga misura sui dati, che spesso si presentano in formati eterogenei, semi-strutturati e non strutturati. Il corso offre una panoramica delle metodologie progettate per migliorare la qualità e l’utilità dei dati che alimentano i sistemi di AI attraverso l’uso dei Knowledge Graphs (KG).

Il corso inizia con un’introduzione ai KG come modelli di dati per la rappresentazione e il ragionamento della conoscenza.

Successivamente, verrà analizzato come questi modelli di dati, combinati con tecniche di Machine Learning (ML), possano fornire soluzioni efficaci per l’arricchimento dei dati nelle applicazioni di AI. Verranno considerati due principali paradigmi di arricchimento dei dati basati sulla combinazione di KG e ML: (1) integrazione semantica dei dati, e (2) KG embeddings e predizione di collegamenti (link prediction).

(1) integrazione semantica dei dati

L’integrazione semantica dei dati si riferisce al processo di costruzione di repository di conoscenza centrati sulle entità, in grado di integrare informazioni provenienti da fonti eterogenee. Il corso si concentrerà principalmente su questo paradigma, presentando diverse tecniche di ML per interpretare, annotare, interconnettere e arricchire dati tabulari e testuali. Queste tecniche includono metodi di NLP basati su KG, come l’interpretazione e l’annotazione semantica di tabelle, la riconciliazione e il collegamento di entità denominate, e il clustering di entità.

Sulla base di questi fondamenti, verrà mostrato come applicare il paradigma dell’integrazione semantica in importanti applicazioni downstream, tra cui i sistemi di Question Answering e le applicazioni di Retrieval-Augmented Generation (RAG).

(2) KG embeddings e predizione di collegamenti (link prediction)

Infine, il corso introdurrà brevemente il secondo paradigma, che si concentra sull’apprendimento di embedding delle rappresentazioni dei KG e sul loro utilizzo per la predizione di collegamenti. In questo contesto, i collegamenti predetti sono interpretati come triple inferite a partire da caratteristiche latenti, piuttosto che da regole di ragionamento esplicite.

2CFU / 16 Ore

Giugno-Luglio 2026

IMPRESE, INNOVAZIONE E INFRASTRUTTURE

Empowering AI through Enriched Data: Combining Knowledge Graphs and Machine Learning

Matteo Palmonari

English

Artificial Intelligence (AI) applications largely rely on data, which often come in diverse semi-structured and unstructured formats. This course provides an overview of methodologies designed to improve the quality and utility of data that underpin AI systems through the use of Knowledge Graphs (KGs).

The course begins with an introduction to KGs as data models for knowledge representation and reasoning.

We then examine how these data models, when combined with Machine Learning (ML), can provide effective solutions for data enrichment in downstream AI applications. Two main families of enrichment paradigms will be considered: (1) semantic data integration, and (2) KG embeddings and link prediction.

(1) Semantic data integration

Semantic data integration refers to the process of constructing entity-centric knowledge repositories that integrate information from heterogeneous sources. The course will focus primarily on this paradigm, presenting a range of ML techniques for interpreting, annotating, interlinking, and augmenting tabular and textual data. These techniques include KG-based NLP methods such as semantic table interpretation and annotation, named entity reconciliation and linking, and entity clustering.

Building on these foundations, we will explore how semantic data integration can be applied in prominent downstream applications, including Question Answering systems and Retrieval-Augmented Generation (RAG) frameworks.

(2) KG embeddings and link prediction

Finally, the course will briefly introduce the second paradigm, which focuses on learning embeddings of KG representations and using them for link prediction. In this context, predicted links are understood as inferred triples derived from latent features rather than from explicit reasoning rules.

2CFU / 16 hours

June-July 2026

INDUSTRY, INNOVATION AND INFRASTRUCTURE

Staff

    Teacher

  • Matteo Luigi Palmonari

Enrolment methods

Manual enrolments
Self enrolment (Student)