Skip to main content
If you continue browsing this website, you agree to our policies:
  • Condizioni di utilizzo e trattamento dei dati
Continue
x
If you continue browsing this website, you agree to our policies:
  • Condizioni di utilizzo e trattamento dei dati
Continue
x
e-Learning - UNIMIB
  • Home
  • More
Listen to this page using ReadSpeaker
 Log in
e-Learning - UNIMIB
Home
Percorso della pagina
  1. Science
  2. Master Degree
  3. Teoria e Tecnologia della Comunicazione [F9202P - F9201P]
  4. Courses
  5. A.A. 2021-2022
  6. 2nd year
  1. Information Retrieval
  2. Summary
Insegnamento Course full name
Information Retrieval
Course ID number
2122-2-F9201P031
Course summary SYLLABUS

Course Syllabus

  • Italiano ‎(it)‎
  • English ‎(en)‎
Export

Obiettivi

L'obiettivo del corso è fornire un'introduzione ai concetti fondamentali relativi a tecniche di Text Mining e rappresentazioni di testi; si presenteranno inoltre alcune applicazioni di Text Mining: Classificazione e clustering di Testi, Topic Modeling, Riassunto Automatico di Testi.  Si faranno accenni a sistemi quali i Motori di Ricerca e i Sistemi per la Raccomandazione di Informazioni.


Contenuti sintetici

Il corso fornirà inizialmente la definizione di Text Mining e indicherà le principali differenze  tra Data Mining e Text Mining.

Il corso introdurrà quindi alcune applicazioni correlate al Text Mining:  riassunto automatico di testi, e classificazione di testi. Tecniche di pre-processing di testi verranno presentate e il problema dell'indicizzazione  di testi e della loro rappresentazione formale verrà affrontato. Il corso introdurrà quindi le applicazioni precedentemente citate. Si introdurranno alcuni software open source per la definizione di applicazioni di Text Mining.

Programma esteso

1.  Definizione di Text Mining e delle principali differenze tra Text Mining e Data Mining.

2.  Breve introduzione di alcune applicazioni correlate al Text Mining

3.  Pre-Processing, indicizzazione e rappresentazione formale di testi

4. Classificazione  e clustering di testi

5. Topic Modelling 

6. Riassunto automatico di testi

7.  Introduzione ai Motori di ricerca testuali e ai Sistemi per la Raccomandazione di Informazione

8.  Software Open Source

Prerequisiti

Conoscenza di base di statistica e di linguaggi di programmazione.


Modalità didattica

Il corso è tenuto in lingua inglese e prevede sia lezioni sia esercitazioni; in laboratorio sarà spiegato e sperimentato l'utilizzo di software “open source”. Sono previsti seminari tenuti da esperti a livello nazionale ed internazionale.

Materiale didattico

Christopher D. Manning, Prabhakar Raghavan and Hinrich Schütze, Introduction to Information Retrieval, Cambridge University Press. 2008. 

Testi specifici su Text Mining  accesibili online verranno indicati durante il corso.        

Periodo di erogazione dell'insegnamento

Primo semestre

Modalità di verifica del profitto e valutazione

Prova scritta e orale individuale, redazione di una relazione di approfondimento di uno degli argomenti introdotti a lezione o a essi correlato.

La prova scritta ha come obiettivo la valutazione del livello di comprensione degli aspetti di base dell'insegnamento erogato, ed è costituita da un insieme di domande a risposta aperta.





Orario di ricevimento

Previo appuntamento con i docenti

Export

Aims

The aim of the course is to provide an introduction to the fundamental concepts related to Text Representation and Text Mining techniques; moreover, in the course some Text Mining applications will be presented: Text Classification and Clustering, Topic Modelling, and Text Summarization. An introduction to Search Engines and Recommender Systems will be provided.


Contents

This course will first provide the definition of Text Mining and will point out the basic differences between Data Mining and Text Mining.

The course will then introduce some tasks involved by Text Mining, which include Text Summarization and Text Classification. The issues of text pre-processing and analysis, and of text indexing and representation will be addressed. Then the course will introduce the previously mentioned tasks. Some open source software for Text Mining  will be introduced and practiced.


Detailed program

1.  Definition of Text Mining and basic differences between Data Mining and Text Mining.

2. Introduction to some  tasks related to Text Mining

3. Text pre-processing, indexing and formal representation

4. Text Classification and Clustering

5. Topic Modelling

6. Text Summarization

7.  Introduction to Text Based Search Engines and to Recommender Systems

8. Open Source software  for Text Mining and Search


Prerequisites

Basic knowledge of statistics and of programming languages.


Teaching form

The course will be taught in English, and it will be constituted of both lectures introducing the main topics and of sessions in a laboratory where open source tools will be explained and employed. Seminars held by experts at national and international level will be part of the course.


Textbook and teaching resource

Christopher D. Manning, Prabhakar Raghavan and Hinrich Schütze, Introduction to Information Retrieval, Cambridge University Press. 2008.

Specific books on text mining that are accessible online will be recommended during the course.       

Semester

First Semester

Assessment method

Written and oral individual examination, redaction of a document in which the student will deepen some of the topics presented during the course, or some related topics.

The written examination is aimed at assessing the level of understanding of the basic aspects taught during the course; it is constituted by a set of open questions.


Office hours

To be agreed with the teachers

Enter

Key information

Field of research
INF/01
ECTS
6
Term
First semester
Activity type
Mandatory to be chosen
Course Length (Hours)
46
Language
English

Students' opinion

View previous A.Y. opinion

Bibliography

Find the books for this course in the Library

Enrolment methods

Manual enrolments
Guest access

You are not logged in. (Log in)
Policies
Get the mobile app
Powered by Moodle
© 2025 Università degli Studi di Milano-Bicocca
  • Privacy policy
  • Accessibility
  • Statistics