- Area di Scienze
- Corso di Laurea Magistrale
- Biologia [F0602Q - F0601Q]
- Insegnamenti
- A.A. 2025-2026
- 1° anno
- Bioinformatica
- Introduzione
Syllabus del corso
Obiettivi
L’insegnamento è focalizzato sulle tecnologie genomiche, su come queste sono utilizzate per la generazione di dati di tipo “-omico”, e sui principali concetti e insidie nell’analisi di questi dati. Il corso si focalizza sulle tecnologie basate su approcci di sequenziamento massivo. Particolare enfasi sarà dedicata allo studio dei programmi di espressione genica, di fattori che legano il DNA e delle modificazioni epigenetiche della cromatina.
Conoscenza e capacità di comprensione.
Gli studenti familiarizzeranno con le principali tecnologie genomiche e i principali tipi di dati. Impareranno le migliori pratiche e le principali modalità di analisi nel campo della genomica.
Una serie di lezioni interattive saranno dedicate a Galaxy, una suite di strumenti di analisi di dati omics gratuitamente disponibile online. Al termine del corso, gli studenti acquisiranno i concetti chiave nel campo della bioinformatica e della genomica, e familiarizzeranno e con risorse di riferimento alle quali potranno tornare durante future attività di ricerca.
Capacità di applicare conoscenza e comprensione.
Lo studente sarà in grado di applicare le conoscenze acquisite nei successivi insegnamenti ed in esperienze di laboratorio e di utilizzare la capacità di comprensione ai fini di successive attività di studio e/o di ricerca.
Autonomia di giudizio.
Lo studente sarà in grado di elaborare quanto appreso e saprà riconoscere le situazioni e i problemi in cui le conoscenze apprese possano essere utilizzate.
Abilità comunicative.
Alla fine dell'insegnamento, lo studente saprà descrivere con proprietà di linguaggio e sicurezza di esposizione argomenti inerenti la genomica e la bioinformatica.
Capacità di apprendimento.
Alla fine dell'insegnamento, lo studente sarà in grado di consultare la letteratura sugli argomenti trattati e saprà analizzare, applicare, integrare e collegare le conoscenze acquisite con quanto verrà appreso in insegnamenti correlati.
Contenuti sintetici
- I programmi di espressione genica e I loro determinanti
- Dalle cellule alla libreria di sequenziamento
- Tecnologie per il sequenziamento massivo di acidi nucleici
- Processamento di dati di sequenziamento
- Analisi di dati ChIP-seq
- Analisi di dati RNA-seq
- Genome-Browsers
- Clustering e heatmaps
- Introduzione a Galaxy
- Analisi di dati ChIP-seq tramite Galaxy
- Analisi di dati RNA-seq tramite Galaxy
- Dinamiche di regolazione trascrizionale
- Studio dei programmi di espressione genica a livello della singola cellula
- Studio della conformazione della cromatina
Programma esteso
- I programmi di espressione genica e I loro determinanti: (i) programmi di espressione genica, (ii) legame di fattori regolativi alla cromatina, (iii) modificazioni epigenetiche, (iv) RNA polimerasi, (v) modificazioni dell’RNA
- Dalle cellule alla libreria di sequenziamento: ChIP-seq, RIP-seq e RNA-seq
- Tecnologie per il sequenziamento massivo di acidi nucleici: (i) sequenziamento a reads corte (Ion Torrent, Illumina), (ii) sequenziamento a reads lunghe (Pacific Biosciences, Oxford Nanopore Technologies)
- Processamento di dati di sequenziamento: (i) FASTQ file, (ii) controlli di qualità, (iii) allineamento delle reads, (iv) SAM/BAM file, (v) ispezione degli allineamenti tramite un genome-browser
- Analisi di dati ChIP-seq: (i) identificazione dei picchi, (ii) falsi positivi e falsi negativi, (iii) arricchimento di motivi, (iv) GeneOntology e arricchimento di insiemi di geni, (v) identificazione dei picchi differenziali
- Analisi di dati RNA-seq: (i) espressione assoluta e normalizzazione, (ii) espressione differenziale, (iii) varianti di splicing, (iv) modificazioni dell’RNA
- Genome-Browsers: IGV/IGB, UCSC genome-browser, caricamento dei dati, ottenimento di immagini, integrazione con dati ENCODE, UCSC Table
- Clustering e heatmaps
- Introduzione a Galaxy: dai picchi ai geni
- Analisi di dati ChIP-seq tramite Galaxy
- Analisi di dati RNA-seq tramite Galaxy
- Dinamiche di regolazione trascrizionale: (i) RNA nascente, (ii) regolazione post-trascrizionale, (iii) ciclo vitale della RNA polimerasi
- Studio dei programmi di espressione genica a livello della singola cellula, scRNA-seq
- Studio della conformazione della cromatina
Prerequisiti
Prerequisiti: nozioni fondamentali di Biologia Molecolare.
Propedeuticità: nessuna.
Modalità didattica
- 12 lezioni da 2 ore svolte in modalità erogativa in presenza;
- 9 lezioni da 2 ore in presenza svolte in modalità erogativa nella parte iniziale che è volta a coinvolgere gli studenti in modo interattivo nella parte successiva. Le lezioni svolte in modalità interattiva prevedono l’utilizzo del sistema di analisi dati Galaxy. Questa parte include un project work facoltativo da parte degli studenti, individuale o di gruppo, riguardante analisi svolte in autonomia con Galaxy. Il project work si conclude con una breve presentazione da parte degli studenti e costituisce una prova parziale d’esame.
Materiale didattico
Slide, articoli scientifici e registrazioni delle lezioni reperibili sulla piattaforma e-learning dell'insegnamento.
Testi consigliati:
- M.H. Citterich et al. “Fondamenti di Bioinformatica” Zanichelli
Periodo di erogazione dell'insegnamento
Secondo semestre
Modalità di verifica del profitto e valutazione
Colloquio sugli argomenti svolti a lezione. La discussione può, a scelta dello studente, includere la discussione di un articolo scientifico pertinente agli argomenti trattati durante il corso, valutando la capacità e l'analisi critica di interpretazione dei risultati.
La valutazione integra il risultato della prova parziale, per gli studenti che hanno scelto di svolgerla, un project work facoltativo finalizzato al controllo delle competenze di problem solving disciplinare.
Orario di ricevimento
Ricevimento su appuntamento via e-mail con il docente.
Sustainable Development Goals
Aims
The course is focused on genomics technologies, on how they are used to generate omics data, and on the fundamental concepts and pitfalls in the analysis of these data. The course focuses on technologies relying on high-throughput sequencing approaches. Particular emphasis will be devoted to the study of genome-wide gene expression programs, DNA-binding factors and epigenetic modifications.
Knowledge and understanding.
Students will familiarize with the key genomic technologies and data types. They will learn good practise and key workflows in the field of genomics. Interactive lessons will focus on Galaxy, a suite of tools freely available online for the analysis of omics data. Eventually, the students will acquire key concepts in the field of bioinformatics and genomics, and they will familiarize with selected resources to which they shall reference in case of need during their future research activities.
Applying knowledge and understanding.
Students will be able to apply the acquired knowledge in other courses and in laboratory experiences and to use the comprehension skill in subsequent studies and/or research activities.
Making judgments.
Students will be able to process what they have learned and be able to recognize situations and problems in which the acquired knowledge can be used.
Communication skills.
At the end of the course, students will be able to express themselves appropriately in the description of issues related to genomics and bioinformatics by using language properties, as well as self-confidence.
Learning skills
At the end of the course, students will be able to survey the scientific literature related to the topics covered and will be able to analyse, apply and integrate the acquired knowledge with what learned in related courses.
Contents
- Gene expression and its determinants
- From cells to a sequencing library
- High-throughput sequencing technologies
- Processing sequencing data, common steps
- ChIP-seq analysis workflow
- RNA-seq analysis workflow
- Genome Browsers
- Clustering and heatmaps
- Introduction to Galaxy
- ChIP-seq data analysis with Galaxy
- RNA-seq data analysis with Galaxy
- Dynamics of transcriptional regulation
- Single cells transcriptional profiling
- Chromatin conformation
Detailed program
- Gene expression and its determinants: (i) gene expression programs, (ii) Binding of regulatory factors to chromatin, (iii) Epigenetic marks, (iv) RNA polymerases, (v) RNA modifications
- From cells to a sequencing library: ChIP-seq, RIP-seq and RNA-seq
- High-throughput sequencing technologies: (i) Short reads sequencing (Ion Torrent, Illumina), (ii) Long reads sequencing (Pacific Biosciences, Oxford Nanopore Technologies)
- Processing sequencing data, common steps: (i) FASTQ files, (ii) quality checks, (iii) reads alignment, (iv) SAM/BAM files, (v) inspecting alignments with a genome browser
- ChIP-seq analysis workflow: (i) peaks calling, (ii) false positives and false negatives, (iii) motif enrichment, (iv) GeneOntology and gene sets enrichment, (v) differential peaks calling
- RNA-seq analysis workflow: (i) absolute expression and normalization, (ii) differential expression, (iii) splicing detection, (iv) RNA modifications
- Genome Browsers: IGV/IGB, UCSC Genome Browser, data upload, download pics, playing with ENCODE tracks, UCSC Table
- Clustering and heatmaps
- Introduction to Galaxy: From peaks to genes
- ChIP-seq data analysis with Galaxy
- RNA-seq data analysis with Galaxy
- Dynamics of transcriptional regulation: (i) Nascent RNA, (ii) Post-transcriptional regulation, (iii) RNA polymerase life cycle
- Single cells transcriptional profiling, scRNA-seq
- Chromatin conformation
Prerequisites
Background: basic notions of Molecular Biology.
Prerequisites: none
Teaching form
- 12 2-hour delivery-focused frontal teaching lectures
- 9 2-hour frontal teaching lectures conducted in lecture mode in the initial part, which is aimed at engaging students interactively in the subsequent part. The lectures conducted in interactive mode involve the use of the Galaxy data analysis system. This part includes optional individual or group project work by the students on analyses carried out independently with Galaxy. The project work concludes with a short presentation by the students and constitutes a partial examination test.
Textbook and teaching resource
Selected scientific papers, slides, and recording of the lessons will be available at the e-learning platform of the course.
Recommended textbooks:
- M.H. Citterich et al. “Fondamenti di Bioinformatica” Zanichelli
Semester
Second semester
Assessment method
Colloquium on the topics covered in the lecture. The discussion may, at the student's choice, include the discussion of a scientific article relevant to the topics covered during the course, assessing the ability and critical analysis to interpret the results.
The assessment integrates the result of the partial examination test, for those students who have chosen to take it, an optional project work aimed at checking disciplinary problem-solving skills.
Office hours
By appointment through e-mail request to the lecturer.
Sustainable Development Goals
Scheda del corso
Staff
-
Mattia Pelizzola