Course information | Signal, audio, and image processing and understanding

Course Syllabus

Italiano ‎(it)‎
English ‎(en)‎

Export

Titolo

Signal, Audio, and Image Processing and Understanding

Docente(i)

Simone Bianco
Luigi Celona
Flavio Piccoli
Paolo Napoletano

Breve descrizione

E' necessario iscriversi almeno una settimana prima della prima lezione.
Se non è possibile iscriversi, inviare un'e-mail al/i docente/i.

Questo corso collega l'elaborazione classica dei segnali e le moderne tecniche di machine learning per i dati multimodali. Gli studenti apprenderanno i fondamenti matematici dei segnali digitali, audio e immagini; esploreranno le moderne architetture profonde che operano su di essi; e comprenderanno come effettura il fine-tuning di large foundation models utilizzando tecniche di Low-Rank Adaptation (LoRA).

Di seguito è riportato un elenco preliminare degli argomenti trattati:

Fondamenti dei segnali digitali:
- Teoria del campionamento, quantizzazione, DFT/FFT, filtri digitali.
Elaborazione e comprensione dei segnali audio:
- Spettrogrammi, features di tonalità e timbro, compressione, rappresentazione del parlato, psicoacustica.
Elaborazione e comprensione dei segnali immagine:
- Formazione delle immagini, spazi colore, filtraggio, estrazione delle features, compressione ed enhancement.
Dai segnali alle rappresentazioni profonde:
- Embedding spettrali di segnali, CNN, autoencoder, transformer e foundation models.
Low-Rank Adaptation (LoRA) and Parameter-Efficient Fine-Tuning:
- Concetti, decomposizione matriciale, efficienza di addestramento, applicazioni in modelli visivi/audio di grandi dimensioni.

La valutazione si baserà su un semplice progetto di gruppo da realizzare in una giornata dedicata (come un breve hackathon) su un argomento scelto dallo studente in coordinamento con il/i docente/i.

CFU / Ore

2 CFU, 16 ore

Periodo di erogazione

Febbraio 2026

Sustainable Development Goals

ISTRUZIONE DI QUALITÁ

Export

Title

Signal, Audio, and Image Processing and Understanding

Teacher(s)

Simone Bianco
Luigi Celona
Flavio Piccoli
Paolo Napoletano

Language

English

Short description

You must enrol at least one week before the first lecture.
If you are unable to enrol, send an email to the teacher(s).

This course bridges classical signal processing and contemporary machine learning for multimodal data. Students will learn the mathematical foundations of digital, audio, and image signals; explore modern deep architectures that operate on them; and understand how to fine-tune large foundation models using Low-Rank Adaptation (LoRA) techniques.

A preliminary list of topics is:

Digital Signal Fundamentals:
- Sampling theory, quantization, DFT/FFT, digital filters.
Audio Signal Processing and Understanding:
- Spectrograms, pitch and timbre features, compression, speech representation, psychoacoustics.
Image Signal Processing and Understanding:
- Image formation, color spaces, filtering, feature extraction, compression, and enhancement.
From Signals to Deep Representations:
- Spectral embeddings for signal data, CNNs, autoencoders, transformers and foundation models.
Low-Rank Adaptation (LoRA) and Parameter-Efficient Fine-Tuning:
- Concept, matrix decomposition, training efficiency, applications in large vision/audio models.

Evaluation will be based on a simple group project to realize in a dedicated day (like a brief hackathon) on a topic selected by the student in coordination with lecturer(s).

Teacher

SB

Simone Bianco
Luigi Celona
Paolo Napoletano
Flavio Piccoli

Manual enrolments

Self enrolment (Student)

Course Syllabus

Titolo

Docente(i)

Lingua

Breve descrizione

CFU / Ore

Periodo di erogazione

Sustainable Development Goals

Title

Teacher(s)

Language

Short description

CFU / Hours

Teaching period

Sustainable Development Goals

Key information

Staff

Teacher

Enrolment methods

Sustainable Development Goals