- Bioinformatic Methodologies
- Summary
Course Syllabus
Obiettivi
L'obiettivo principale del corso è quello di introdurre gli studenti alle principali problematiche relative all'analisi computazionale di sequenze biologiche (DNA, RNA, proteine) e alla costruzione e simulazione di modelli matematici predittivi per la biologia. Gli studenti acquisiranno le conoscenze ed i concetti di base relativi alle metodologie e alle tecniche computazionali per la raccolta, la gestione e l'analisi di dati in biologia molecolare, e la padronanza dei principali strumenti computazionali necessari per estrarre informazioni di interesse per la ricerca biomedica dalle principali banche dati di sequenze.
Contenuti sintetici
1) Introduzione alla bioinformatica: motivazioni, problemi e metodologie
2) Allineamenti tra sequenze: allineamento globale, locale e multiplo
3) Organizzazione e gestione dei dati: le principali basi di dati; accesso, interrogazione, inserimento dati
4) Ricostruzione di alberi filogenetici
5) Studio del genoma: mappatura, sequenziamento, annotazione, ricostruzione
6) Reti di trascrizione: grafi e modelli computazionali; analisi del trascrittoma
Programma esteso
1) Elementi di Informatica: architettura di un computer, sistemi operativi, algoritmi, linguaggi di programmazione e basi di dati
2) Allineamento tra sequenze. Allineamento globale: similarità e omologia; matrice di punti; programmazione dinamica, traceback. Allineamento locale: matrici di sostituzione (PAM e BLOSUM); algoritmo di Smith & Waterman; ricerca euristica su database (BLAST, FASTA). Allineamenti multipli: allineamento progressivo (Clustal)
3) Basi di dati di sequenze molecolari. Basi di dati di sequenze genomiche (EMBL – GenBank) e proteiche (SwissProt, PDB). Sistemi di interrogazione delle basi di dati (NCBI, UCSC Genome Browser). Piattaforme di ricerca e analisi bioinformatiche (Galaxy).
4) Ricostruzione di alberi filogenetici. Metodi basati sulla distanza: clustering (UPGMUA e Neighbor Joining). Metodi “character-based” (massima parsimonia, massima verosimiglianza)
5) Studio del genoma. Mappatura. Sequenziamento: Sanger, Next Generation Sequencing (NGS), base calling. Annotazione: FASTA, FASTQ. Ricostruzione
6) Reti transcrizione. Analisi del trascrittoma: microarray, RNA-sequencing. Teoria dei grafi come strumento per la descrizione di una rete di trascrizione: distribuzione dei nodi in ingresso e in uscita. Motivi di rete. Modelli computazionali di regolazione dell’espressione genica: il caso dell’autoregolazione negativa
Prerequisiti
Nessuno: tutti i concetti necessari di informatica e matematica sono forniti nel corso
Modalità didattica
Lezioni frontali con slides.
Esercitazioni in aula di calcolo per l'utilizzo di banche dati biologiche e piattaforme di analisi bioinformatiche.
Tutte le lezioni ed esercitazioni saranno videoregistrate e disponibili su Moodle
Materiale didattico
Slides delle lezioni e delle esercitazioni reperibili sulla pagina e-learning dell'insegnamento.
Testi consigliati: Helmer Citterich M, Ferrè F, Pavesi G, Romualdi C, Pesole G. Fondamenti di bioinformatica. Zanichelli, 2018.
Periodo di erogazione dell'insegnamento
Primo semestre
Modalità di verifica del profitto e valutazione
Lo studente verrà valutato sulla presentazione di un articolo scientifico precedentemente assegnatogli + domande orale su tutto il programma svolto a lezione
Orario di ricevimento
Gli studenti sono invitati a contattare il docente per email per accordarsi su data e giorno (eventualmente via WebEx)
Aims
The main objectives of the course are to introduce students to the main problems related to the computational analysis of biological sequences (DNA, RNA, proteins) as well as to the synthesis and simulation of mathematical models in biology. Students will acquire the basic knowledge and concepts related to computational methods and techniques for collecting, managing and analyzing data in molecular biology, and will master the main computational tools necessary to extract information of interest for biomedical research from the main sequencing databases.
Contents
1) Introduction to bioinformatics: motivations, problems and methodologies
2) Organization and management of data: the main biological databases; access, query, data entry and data analysis
3) Sequence comparison: global, local and multiple alignment algorithms
4) Building of a phylogenetic tree
5) Structural genomics: mapping, sequencing, annotation, reconstruction
6) Trascription networks: graphs and computational models; transcriptome analysis
Detailed program
1) Basics of Informatics: computer acrhitecture, operating systems, algorithms, programming languages, databases
2) Sequence alignment. Global alignment: similarity score and homology; dot-matrix method; dynamic programming, traceback. Local alignment: substitution matrices (PAM and BLOSUM); Smith & Waterman algorithm; heuristic database searching (BLAST, FASTA). Multiple sequence alignment: progressive alignment (Clustal)
3) Biological databases: Genomic databases (EMBL – GenBank). Protein databases (SwissProt, PDB). Database query systems and bioinformatics platforms (NCBI, UCSC Genome Browser, Galaxy).
4) Building of phylogenetic trees. Distance-based methods: custering (UPGMUA and Neighbor Joining). Character-based methods (maximum parsimony, maximum likelihood)
5) Genome mapping, sequencing (Sanger, Next Generation sequencing, base calling), annotation (FASTA, FASTQ), reconstruction
6) Transcription networks. Transcriptome analysis: microarray, RNA-sequencing. Graph theory to describe transcription natworks: in- and out-degree distribution. Network motifs. Computational models of gene expression and regulation: the negative autoregulation case
Prerequisites
No prerequisites: all concepts from informatics or mathematics are provided in the course
Teaching form
Classroom lectures with slides.
Hands-on sessions on pc for the use of biological databases and bioinformatics platforms.
All lessons will be videorecorded and available on Moodle.
Textbook and teaching resource
Slides. All educational material will be available at the e-learning platform of the course.
Textbooks: Helmer Citterich M, Ferrè F, Pavesi G, Romualdi C, Pesole G. Fondamenti di bioinformatica. Zanichelli, 2018.
Semester
First semester
Assessment method
Students will discuss a scientific paper, previously given. Besides, oral questions on the programme
Office hours
Students are invited to contact the teacher by email to agree upon a date (possibly on WebEx)