Course Syllabus
Obiettivi
Il corso si propone di fornire agli studenti i principali concetti alla base della gestione dei dati provenienti dal Web e dai social media, dalla raccolta, alla modellazione, alla successiva analisi. In particolare, gli studenti saranno in grado di recuperare e archiviare dati dal Web sociale, sia attraverso l'uso di API che di scraping, di utilizzare rappresentazioni avanzate (sia topologiche che semantiche) e di analizzare e visualizzare strutture di rete complesse e le relative analisi. Una parte del corso si concentrerà in particolare sui concetti di Web search e social search e sullo studio dei modelli e delle dimensioni di rilevanza più appropriate nel contesto del Web sociale.
Contenuti sintetici
- Introduzione al Web sociale;
- I dati nel Web e nei social media;
- Rappresentare reti di interazioni complesse: teoria dei grafi e delle reti;
- Social Network Analysis (SNA): metriche e algoritmi per l'identificazione di comunità;
- Social Content Analysis (SCA): analisi della soggettività e del sentiment, rilevamento dell'ironia, riconoscimento di entità e linking;
- Web e Social search: i modelli di IR nel Web e nelle reti sociali, le dimensioni di rilevanza, la valutazione dei risultati di ricerca;
- Visualizzazione dei dati reperiti nel Web sociale e analisi di tali dati.
Programma esteso
1. Introduzione
- Introduzione al Web (1.0, 2.0), Web semantico e Web sociale e alla terminologia utilizzata;
- Gli “oggetti informativi” nel Web sociale;
- Web e Social Media Analytics: definizione e obiettivi, i concetti di auto-presentazione e auto-rivelazione, gli incentivi impliciti ed espliciti.
2. I dati nel Web sociale
- Le principali piattaforme, le tipologie di dato, le interfacce di programmazione, il processo di crawling e di scraping.
- Pre-processing e memorizzazione di dati nel Web sociale.
- Cenni di problematiche legate alla raccolta dei dati, sia dal punto di vista legale (il GDPR) sia dal punto di vista tecnologico.
3. Rappresentare strutture complesse dei dati online: teoria dei grafi e delle reti
- Strutture dati elementari e complesse;
- Rappresentazione di reti di interazione mediante grafi (teoria dei grafi, tipologie di reti).
4. Social Network Analysis (SNA)
- Link analysis, Web link analysis, principali metriche;
- Network clustering: algoritmi di community detection;
- Modelli di influenza e contagio nelle reti sociali.
5. Social Content Analysis (SCA)
- Introduzione a concetti di Natural Language Processing nell'ambito delle reti sociali;
- Oggettività/soggettività, polarità, emozioni e ironia nelle reti sociali;
- Approcci lessicali e approcci semantici;
- Named-Entity Recognition e Linking.
6. Web & Social search
- I principali modelli di IR nel Social Web;
- Le dimensioni di rilevanza;
- La valutazione dei risultati di ricerca.
7. Visualizzazione dei dati reperiti dal Web sociale e analisi di tali dati
- Interfacce grafiche;
- Usabilità e studi per mezzo di utenti.
Prerequisiti
Sono richieste competenze base di algebra lineare e programmazione.
Modalità didattica
- Lezioni frontali;
- Esercitazioni in aula;
- Esercitazioni in laboratorio.
L'insegnamento verrà tenuto in lingua inglese.
Materiale didattico
Verranno fornite slide, approfondimenti e letture suggerite durante il corso.
Libri suggeriti:
- Greenlaw, R., & Hepp, E. (2001). Inline/online: fundamentals of the internet and the world wide web. McGraw-Hill, Inc.
- Rahman, M. S. (2017). Basic graph theory (Vol. 9). Cham: Springer.
- Knoke, D., & Yang, S. (2019). Social network analysis. SAGE publications.
- Liu, B. (2020). Sentiment analysis: Mining opinions, sentiments, and emotions. Cambridge university press.
- Ledford, J. L. (2015). Search engine optimization bible (Vol. 584). John Wiley & Sons.
Periodo di erogazione dell'insegnamento
Secondo semestre
Modalità di verifica del profitto e valutazione
Prova scritta con esercizi e domande aperte
La prova scritta ha come obiettivo la valutazione estensiva ed intensiva delle competenze teoriche e teorico-pratiche acquisite durante il corso.
Progetto di gruppo (con presentazione orale)
Il progetto ha come obiettivo la valutazione della capacità degli studenti di tradurre in ambiti applicativi reali le competenze acquisite durante il corso, attraverso lo sviluppo e l'impiego di soluzioni tecnologiche per l'analisi ed il reperimento dei dati nel Web sociale.
Valutazione globale
- La prova scritta viene valutata su una scala da 0 a 24
- Gli studenti devono ottenere una valutazione maggiore o uguale a 12 nella prova scritta.
- Il progetto, con relativa discussione orale, viene valutato su una scala da 0 a 8.
- Il voto finale sarà dato dalla somma del voto ottenuto nell'esame scritto e dal voto relativo al progetto.
Orario di ricevimento
Su appuntamento: Marco Viviani (marco.viviani@unimib.it)
Sustainable Development Goals
Aims
The course aims to provide students with the main concepts behind the management of data originating from the Web and social media, from collection, to modeling, to subsequent analysis. Students will be able, in particular, to retrieve and store data from the Social Web, either through the use of APIs or scraping, to use advanced representations (both topological and semantic), and to analyze and visualize complex network structures and related analyses. Part of the course will focus especially on the concepts of "Web search" and "social search" and the study of the most appropriate models and dimensions of relevance in the context of the Social Web.
Contents
- Introduction to the Social Web;
- Data in the Web and social media;
- Representing complex network structures: graph and network theory;
- Social Network Analysis (SNA): metrics and algorithms for community detection;
- Social Content Analysis (SCA): subjectivity and sentiment analysis, irony detection, Named-Entity Recognition (NER) and linking;
- Web and Social search: IR models in the Social Web, relevance dimensions, evaluation of search results;
- Visualization of data retreived from the Web and social media and analysis of such data.
Detailed program
1. Introduction
- Introduction to the Web (1.0, 2.0), Semantic Web and Social Web and the terminology used;
- The "information objects" in the Social Web;
- Web and Social Media Analytics: definition and objectives, the concepts of self-presentation and self-revelation, implicit and explicit incentives.
2. Data in the Social Web.
- The main platforms, data types, programming interfaces, the process of crawling and scraping.
- Pre-processing and storage of Social Web data.
- Hints of data collection issues, both from a legal (the GDPR) and technological perspective.
3. Representing complex online data structures: graph and network theory
- Elementary and complex data structures;
- Representation of network structures using graphs (graph theory, types of networks).
4. Social Network Analysis (SNA)
- Link analysis, Web link analysis, main metrics;
- Network clustering: community detection algorithms;
- Influence and contagion models in social networks.
5. Social Content Analysis (SCA)
- Introduction to Natural Language Processing concepts in the context of social networks;
- Objectivity/subjectivity, polarity, emotion and irony in social networks;
- Lexical and semantic approaches;
- Named-Entity Recognition and Linking.
6. Web and Social search
- The main IR models in the Social Web;
- Dimensions of relevance;
- The evaluation of search results.
7. Visualization of data retrieved from the Social Web and analysis of such data
- Graphical interfaces;
- Usability and user studies.
Prerequisites
Basic skills in linear algebra and programming are required.
Teaching form
- Frontal lectures;
- Classroom exercises;
- Laboratory exercises.
Teaching will be given in English.
Textbook and teaching resource
Slides, insights and suggested readings during the course will be provided.
Suggested books:
- Greenlaw, R., & Hepp, E. (2001). Inline/online: fundamentals of the internet and the world wide web. McGraw-Hill, Inc.
- Rahman, M. S. (2017). Basic graph theory (Vol. 9). Cham: Springer.
- Knoke, D., & Yang, S. (2019). Social network analysis. SAGE publications.
- Liu, B. (2020). Sentiment analysis: Mining opinions, sentiments, and emotions. Cambridge university press.
- Ledford, J. L. (2015). Search engine optimization bible (Vol. 584). John Wiley & Sons.
Semester
Second semester
Assessment method
Written exam with exercises and open questions
The written exam aims at extensive and intensive assessment of theoretical and theoretical-practical skills acquired during the course.
Group project (with oral presentation)
The project aims to assess the students' ability to translate the skills acquired during the course into real application areas through the development and use of technological solutions for data analysis and retrieval in the Social Web.
Global evaluation
- Written exam is graded on a scale of 0 to 24
- Students must score greater than or equal to 12 in the written test;
- The project, with associated oral discussion, is graded on a scale of 0 to 8;
- The final grade will be given by the sum of the grade obtained in the written exam and the grade related to the project.
Office hours
By appointment: Marco Viviani (marco.viviani@unimib.it)
Sustainable Development Goals
Key information
Staff
-
Davide Mancino
-
Marco Viviani