Skip to main content
If you continue browsing this website, you agree to our policies:
  • Condizioni di utilizzo e trattamento dei dati
Continue
x
If you continue browsing this website, you agree to our policies:
  • Condizioni di utilizzo e trattamento dei dati
Continue
x
e-Learning - UNIMIB
  • Home
  • More
Listen to this page using ReadSpeaker
You are currently using guest access
 Log in
e-Learning - UNIMIB
Home
Percorso della pagina
  1. Science
  2. Master Degree
  3. Teoria e Tecnologia della Comunicazione [F9202P - F9201P]
  4. Courses
  5. A.A. 2022-2023
  6. 2nd year
  1. Information Retrieval
  2. Summary
Insegnamento Course full name
Information Retrieval
Course ID number
2223-2-F9201P031
Course summary SYLLABUS
Sei stato reindirizzato al corso mutuato, che potrebbe essere anche in altro anno di corso e altro corso di laurea

Course Syllabus

  • Italiano ‎(it)‎
  • English ‎(en)‎
Export

Obiettivi

L'obiettivo del corso è quello di fornire un'introduzione ai concetti fondamentali relativi alle tecniche di rappresentazione del testo e di estrazione del testo; inoltre, nel corso verranno presentate alcune applicazioni di Text Mining: Text Classification and Clustering, Topic Modelling, e Text Summarization. Verrà fornita un'introduzione ai motori di ricerca e ai sistemi di raccomandazione.

Contenuti sintetici

Questo corso fornirà innanzitutto la definizione di Text Mining e indicherà le differenze fondamentali tra Data Mining e Text Mining.

Il corso introdurrà quindi alcune attività coinvolte nel Text Mining, che includono il riepilogo del testo e la classificazione del testo. Verranno affrontati i problemi della pre-elaborazione e analisi del testo e dell'indicizzazione e rappresentazione del testo. Quindi il corso introdurrà i compiti precedentemente menzionati. Verranno introdotti e praticati alcuni software open source per il Text Mining.

Programma esteso

  1. Definizione di Text Mining e differenze fondamentali tra Data Mining e Text Mining
  2. Introduzione ad alcune attività relative al Text Mining
  3. Pre-elaborazione del testo, indicizzazione e rappresentazione formale
  4. Classificazione e clustering del testo
  5. Modellazione dell'argomento
  6. Riepilogo del testo
  7. Introduzione ai motori di ricerca testuali e ai sistemi di raccomandazione
  8. Software Open Source per il Text Mining e la Ricerca

Prerequisiti

Conoscenza di base della statistica e dei linguaggi di programmazione.

Modalità didattica

Il corso sarà tenuto in lingua inglese, e sarà costituito sia da lezioni frontali introduttive agli argomenti principali, sia da sessioni in laboratorio in cui verranno spiegati e utilizzati gli strumenti open source.
Faranno parte del corso seminari tenuti da esperti di livello nazionale e internazionale.

Materiale didattico

Christopher D. Manning, Prabhakar Raghavan e Hinrich Schütze, Introduzione al recupero delle informazioni, Cambridge University Press. 2008.

Durante il corso saranno consigliati libri specifici sul text mining accessibili online.

Periodo di erogazione dell'insegnamento

Primo semestre

Modalità di verifica del profitto e valutazione

Esame scritto individuale, definizione di un progetto di laboratorio (project work) che può essere sviluppato anche da gruppi di studenti (fino a tre studenti).
La prova scritta è finalizzata ad accertare il livello di comprensione degli aspetti di base insegnati durante il corso; è costituito da un insieme di domande aperte.
L'obiettivo del progetto di gruppo è l'utilizzo di software open source che verranno impiegati per sviluppare soluzioni tecnologiche ai problemi affrontati nel corso. In particolare verranno presi in considerazione reali ambiti applicativi, che richiedono la definizione di sistemi presentati durante il corso.

Orario di ricevimento

To be agreed with the teachers

Export

Aims

The aim of the course is to provide an introduction to the fundamental concepts related to Text Representation and Text Mining techniques; moreover, in the course some Text Mining applications will be presented: Text Classification and Clustering, Topic Modelling, and Text Summarization. An introduction to Search Engines and Recommender Systems will be provided.

Contents

This course will first provide the definition of Text Mining and will point out the basic differences between Data Mining and Text Mining.

The course will then introduce some tasks involved by Text Mining, which include Text Summarization and Text Classification. The issues of text pre-processing and analysis, and of text indexing and representation will be addressed. Then the course will introduce the previously mentioned tasks. Some open source software for Text Mining will be introduced and practiced.

Detailed program

  1. Definition of Text Mining and basic differences between Data Mining and Text Mining
  2. Introduction to some tasks related to Text Mining
  3. Text pre-processing, indexing and formal representation
  4. Text Classification and Clustering
  5. Topic Modelling
  6. Text Summarization
  7. Introduction to Text Based Search Engines and to Recommender Systems
  8. Open Source software for Text Mining and Search

Prerequisites

Basic knowledge of statistics and of programming languages.

Teaching form

The course will be taught in English, and it will be constituted of both lectures introducing the main topics and of sessions in a laboratory where open source tools will be explained and employed.
Seminars held by experts at national and international level will be part of the course.

Textbook and teaching resource

Christopher D. Manning, Prabhakar Raghavan and Hinrich Schütze, Introduction to Information Retrieval, Cambridge University Press. 2008.

Specific books on text mining that are accessible online will be recommended during the course.

Semester

First Semester

Assessment method

Written individual examination, definition of a laboratory project (project work) that can be developed also by groups of students (up to three students).
The written examination is aimed at assessing the level of understanding of the basic aspects taught during the course; it is constituted by a set of open questions.
The goal of the group project is the usage of open source software that will be employed to develop technological solutions to the problems addressed in the course. In particular, real application areas will be considered, which require the definition of systems presented during the course.

Office hours

Da concordare con i docenti

Enter

Key information

Field of research
INF/01
ECTS
6
Term
First semester
Activity type
Mandatory to be chosen
Course Length (Hours)
46
Degree Course Type
2-year Master Degreee
Language
English

Students' opinion

View previous A.Y. opinion

Bibliography

Find the books for this course in the Library

Enrolment methods

Manual enrolments
Guest access

You are currently using guest access (Log in)
Policies
Get the mobile app
Powered by Moodle
© 2025 Università degli Studi di Milano-Bicocca
  • Privacy policy
  • Accessibility
  • Statistics