- Social Media Analytics
- Summary
Course Syllabus
Obiettivi
Il corso mira a fornire agli studenti i principali concetti che stanno alla base della gestione dei dati originati nei media sociali (accesso, pre-processing, modellazione) e della loro successiva analisi. Gli studenti saranno in grado, in particolare, di collezionare, processare e analizzare dati provenienti dai principali media sociali, utilizzando le tecnologie più adatte allo scopo. Sarà inoltre in grado di fornire una rappresentazione di strutture sociali complesse al fine di estrarne informazioni utili.
Contenuti sintetici
- Introduzione al Web sociale;
- I dati nei media sociali e problematiche connesse;
- La rappresentazione dei dati sociali mediante strutture sociali complesse: teoria dei grafi e delle reti;
- Analisi topologica delle reti sociali: le principali metriche;
- Analisi topologica delle reti sociali: algoritmi per l'identificazione delle comunità nelle reti sociali;
- Analisi dei contenuti nell reti sociali: soggettività, “sentiment” e ironia;
- Analisi dei contenuti nell reti sociali: Named-Entity Recognition e Linking;
- Visualizzazione di dati provenienti da social media e delle analisi su tali dati.
Programma esteso
1. Introduzione
- Introduzione al Web sociale e alla terminologia utilizzata: Web sociale, reti sociali, media sociali, contenuto generato dagli utenti;
- Gli “oggetti informativi” sul Web sociale: 1) testi: post, blog, microblog, 2) immagini, 3) audio, 4) video;
- Social Media Analytics: definizione e obiettivi, i concetti di auto-presentazione e auto-rivelazione.
2. I dati nei media sociali
- Le principali piattaforme, le tipologie di dato, le interfacce di programmazione, il processo di crawling.
- Pre-processing e memorizzazione di dati sociali.
- Cenni di problematiche legate alla raccolta dei dati, sia dal punto di vista legale (il GDPR) sia dal punto di vista tecnologico.
3. La rappresentazione dei dati sociali
- Strutture dati elementari e complesse;
- Rappresentazione di strutture sociali mediante grafi (teoria dei grafi, tipologie di reti).
4./5. Analisi delle reti sociali
- Link analysis, Web link analysis, principali metriche;
- Network clustering: algoritmi di community detection;
- Modelli di influenza e contagio nelle reti sociali.
6./7. Analisi dei contenuti nelle reti sociali
- Introduzione a concetti di Natural Language Processing nell'ambito delle reti sociali;
- Oggettività/soggettività, polarità, emozioni e ironia nelle reti sociali;
- Approcci lessicali e approcci semantici;
- Named-entity Recognition e Linking.
8. Visualizzazione di dati provenienti da social media: problemi aperti e tecniche
Prerequisiti
Conoscenza di base dei principi di algebra lineare, statistica, programmazione.
Modalità didattica
- Lezioni
- Esercitazioni in laboratorio
- Il corso verrà tenuto in lingua inglese
Materiale didattico
- Rahman, Md Saidur. Basic graph theory. Springer, 2017.
- Reinhard Diestel. Graph Theory. Springer, 2017.
- Suliman Hawamdeh, Hsia-Ching Chang. Analytics and Knowledge Management. CRC Press. 2018.
- John Scott. Social Network Analysis. Sage, 2012.
- Bing Liu. Sentiment Analysis and Opinion Mining. Morgan & Claypool. 2016.
- Eneko Agirre, Philip Edmonds. Word Sense Disambiguation: Algorithms and Applications (Text, Speech and Language Technology). Springer. 2007.
Periodo di erogazione dell'insegnamento
Primo semestre
Modalità di verifica del profitto e valutazione
Prova scritta con esercizi e domande aperte.
La prova scritta ha come obiettivo la valutazione estensiva ed intensiva delle competenze teoriche e teorico-pratiche acquisite durante il corso.
Progetto di gruppo (con presentazione orale).
Il progetto ha come obiettivo la valutazione della capacità degli studenti di tradurre in ambiti applicativi reali le competenze acquisite durante il corso, attraverso lo sviluppo e l'impiego di soluzioni tecnologiche per l'analisi dei dati nei social media.
- La prova scritta viene valutata su una scala da 0 a 24.
- Gli studenti devono ottenere una valutazione maggiore o uguale a 12 nella prova scritta.
- Il progetto, con relativa discussione orale, viene valutato su una scala da 0 a 8.
Il voto finale sarà dato dalla somma del voto ottenuto nell'esame scritto e dal voto relativo al progetto.
Orario di ricevimento
Su appuntamento: Marco Viviani (marco.viviani@unimib.it)
Sustainable Development Goals
Aims
The course aims to provide students with the main concepts behind the management of data originated in social media (access, pre-processing, modeling) and their subsequent analysis. Students will be able, in particular, to collect, process and analyze data from major social media, using the most suitable technologies for the purpose. They will also be able to provide a representation of complex social structures in order to extract useful information from them.
Contents
- Introduction to the Social Web;
- Data in social media and related issues;
- Representing complex social data structures: graph and network theory;
- Social Network Analysis: metrics;
- Social Network Analysis: algorithms for community detection in social networks;
- Social Content Analysis: subjectivity and sentiment analysis, irony detection;
- Social Content Analysis: Named Entity Recognition and Linking;
- Visualization of data from social media and the analysis on such data.
Detailed program
1. Introduction
- The Social Web: introduction and related terminology: Social Web, Social Networks, Social Media, User-Generated Content (UGC);
- Different classes of social “information objects”: 1) texts: posts, blogs, microblogs, 2) images, 3) audios, 4) videos;
- Social Media Analytics: definition and objectives. The concepts of auto-presentation and auto-disclosure.
2. Data in social media
- Main social platforms, Advanced Programming Interfaces (API)s, the “crawling” process;
- Pre-processing and storing of social data;
- Hints of data collection issues, both legally (the GDPR) and technologically.
3. Social data representation
- Elementary and complex data structures;
- Representing social structures via a graph-based representation (graph theory, network topologies).
4./5. Social Network Analysis
- Link analysis, Web link analysis, and related metrics;
- Network clustering: community-detection algorithms;
- Influence and contagion in social media.
6./7. Social Content Analysis
- Introduction to concepts of Natural Language Processing in the context of social networks;
- Objectivity/subjectivity, polarity, emotion and irony in social networks;
- Lexical and Semantic Approaches;
- Named-entity Recognition and Linking.
8. Visualization of social media data: open issues and techniques
Prerequisites
Basic knowledge of the principles of linear algebra, statistics, programming.
Teaching form
- Lectures
- Laboratory exercises
- The course will be held in English
Textbook and teaching resource
- Rahman, Md Saidur. Basic graph theory. Springer, 2017.
- Reinhard Diestel. Graph Theory. Springer, 2017.
- Suliman Hawamdeh, Hsia-Ching Chang. Analytics and Knowledge Management. CRC Press. 2018.
- John Scott. Social Network Analysis. Sage, 2012.
- Bing Liu. Sentiment Analysis and Opinion Mining. Morgan & Claypool. 2016.
- Eneko Agirre, Philip Edmonds. Word Sense Disambiguation: Algorithms and Applications (Text, Speech and Language Technology). Springer. 2007.
Semester
First semester
Assessment method
Written exam with exercices and open questions.
The written test aims at the extensive and intensive evaluation of the theoretical and theoretical-practical skills acquired during the course.
Group project (with oral presentation).
The project aims to assess students' ability to translate the skills acquired during the course into real application fields, through the development and use of technological solutions for analyzing social media data.
- The written exam is assessed on a scale from 0 to 24.
- Students must obtain a grade of 12 or more in the written exam.
- The project, with relative oral discussion, is evaluated on a scale from 0 to 8.
The final grade will be given by the sum of the evaluation obtained in the written exam and by the evaluation related to the project.
Office hours
By appointment: Marco Viviani (marco.viviani@unimib.it)