Syllabus del corso
Obiettivi formativi
Il corso ha l’obiettivo di fornire agli studenti competenze pratiche nell’uso del linguaggio R per l’analisi e la rappresentazione dei dati. Partendo dall’ambiente di lavoro e dalle strutture dati fondamentali, il corso guiderà gli studenti attraverso le tecniche di importazione, manipolazione e unione di dataset, fino alla produzione di visualizzazioni grafiche efficaci. Al termine del corso, gli studenti saranno in grado di utilizzare R e le principali librerie del suo ecosistema per affrontare autonomamente problemi reali di analisi dei dati.
Contenuti sintetici
- Ambiente di lavoro in R (RStudio, progetti, script)
- Strutture dati in R: scalari, vettori, data frame
- Importazione dei dati e buone prassi di organizzazione del progetto
- Manipolazione dei data frame: esplorazione, selezione, filtraggio, valori mancanti
- Unione di data frame: concatenazione e join
- Visualizzazione dei dati con ggplot2
Programma esteso
- Introduzione a R e RStudio
- Ambiente di lavoro: console, script, workspace
- R come calcolatrice: operatori aritmetici e funzioni matematiche
- Oggetti e variabili: creazione, ispezione e cancellazione
- Progetti R e organizzazione riproducibile delle cartelle di lavoro
- Strutture dati in R: tutto è un vettore
* Scalari
* Vettori: creazione, indicizzazione, operazioni
* Progressioni aritmetiche e sequenze - Data frame: struttura e creazione
- Importazione di dati da file CSV
- Esplorazione di un data frame: struttura, dimensioni e statistiche descrittive
- Estrazione di colonne e sottoinsiemi di righe
- Valori mancanti: identificazione, conteggio e rimozione
- Concatenazione di data frame per righe
- Fusione di data frame: inner join e outer join
- La grammatica della grafica: il pacchetto ggplot2
- Struttura di un grafico ggplot2: dati, estetica, geometrie
- Principali tipi di grafico e personalizzazione
Prerequisiti
Nessun prerequisito formale richiesto.
Metodi didattici
- Lezione frontale
- Esercitazioni in laboratorio
- Simulazioni d’esame (per permettere allo studente di prendere confidenza con la piattaforma d’esame e la propria preparazione)
Modalità di verifica dell'apprendimento
L’appello consiste in una prova scritta all’elaboratore che richiede la risoluzione di esercizi tramite lo sviluppo di un programma in R.
La natura dell’esame scritto permette di verificare le conoscenze specifiche dello studente e la sua capacità di costruire un percorso logico per affrontare e risolvere un problema di analisi dei dati.
Orale facoltativo (su richiesta del docente o dello studente se sufficiente). L’orale può comportare sia l’aumento che la diminuzione della valutazione della prova scritta.
Testi di riferimento
Le slide, gli esercizi ed in generale tutto il materiale presentato a lezione sarà pubblicato su questo sito web.
Periodo di erogazione dell'insegnamento
II semestre
Lingua di insegnamento
Italiano
Sustainable Development Goals
Learning objectives
The course aims to provide students with practical skills in using the R language for data analysis and representation. Starting from the working environment and fundamental data structures, the course will guide students through techniques for importing, manipulating, and joining datasets, up to the production of effective graphical visualizations. Upon completion of the course, students will be able to use R and the main libraries of its ecosystem to independently tackle real-world data analysis problems.
Contents
- The R working environment (RStudio, projects, scripts)
- Data structures in R: scalars, vectors, data frames
- Data import and project organization best practices
- Data frame manipulation: exploration, selection, filtering, missing values
- Joining data frames: row-binding and merge/join
- Data visualization with ggplot2
Detailed program
- Introduction to R and RStudio
- Working environment: console, scripts, workspace
- R as a calculator: arithmetic operators and mathematical functions
- Objects and variables: creation, inspection and deletion
- R projects and reproducible folder organization
- Data structures in R: everything is a vector
* Scalars
* Vectors: creation, indexing, operations
* Arithmetic progressions and sequences - Data frames: structure and creation
- Importing data from CSV files
- Exploring a data frame: structure, dimensions and descriptive statistics
- Extracting columns and row subsets
- Missing values: identification, counting and removal
- Concatenating data frames by rows
- Merging data frames: inner join and outer join
- The grammar of graphics: the ggplot2 package
- Structure of a ggplot2 chart: data, aesthetics, geometries
- Main chart types and customization
Prerequisites
None.
Teaching methods
- Frontal lecture
- Hands-on session in a computer science laboratory
- Final test simulation (to introduce the student to the test platform and help them gain knowledge about their preparation level)
Assessment methods
The examination consists of a written part held in a computer lab. The examination requires to solve exercises by means of a program developed in R.
The nature of the written test allows to verify the specific knowledge of the student, together with its ability to build a logic path to tackle and solve a data analysis problem.
Facultative oral exam (on request of the teacher or of the students). The oral exam can both increase or decrease the overall evaluation.
Textbooks and Reading Materials
All the material presented during the lectures will be published on this web site.
Semester
II semester
Teaching language
Italian