Corso: Laboratorio di Informatica (blended)

Indice degli argomenti

Seleziona argomento Introduzione

Introduzione
- Seleziona attività Avvisi
  
  Forum
  
  Avvisi Forum
- Seleziona attività Slides SAS
  
  URL
  
  Slides SAS URL
- Seleziona attività Slides R
  
  URL
  
  Slides R URL
- Seleziona attività Forum di supporto per tutti gli argomenti del corso
  
  Forum
  
  Forum di supporto per tutti gli argomenti del corso
- Seleziona attività Dichiarazione di impegno da parte dello studente ad attenersi al codice etico
  
  Compito
  
  Dichiarazione di impegno da parte dello studente ad attenersi al codice etico Compito
- Seleziona attività Risorse su SAS SAS University Edition (si tratta ...
  
  Risorse su SAS
  
  SAS University Edition (si tratta di una macchina virtuale con SAS Studio già installato). E' il modo più semplice per avere SAS ed è quello che viene utlizzato nei video.
  Corso online offerto da SAS Institute sulle basi di SAS. I contenuti non sono identici a quelli del corso, ma può essere una risorsa integrativa.
- Seleziona attività Organizzazione del corsoIl corso è organizzato su ...
  
  Organizzazione del corso
  Il corso è organizzato su 3 sezioni. Per ogni sezione ci sarà una lezione frontale dove verranno introdotte le nozioni trattate nel corso. Stante la situazione attuale, le lezioni frontali sono sostituite da videolezioni.
  Le attività online consistono di esercizi che prevedono la scrittura di brevi programmi in SAS che devono essere scritti e consegnati da ogni studente. Dopo avere consegnato il programma, si potrà vedere una soluzione proposta e un video che mostra il processo cognitivo che ha portato alla stesura di una soluzione.
  Nelle settimane in cui non è prevista una lezione frontale, ci sarà un'attività online in cui la soluzione di un esercizio viene discussa rendendo possiibli interazioni docente-studenti. Tutte le attività online saranno registrate.
  Gli studenti devono usare i forum per tutte le discussioni inerenti il corso. Non verranno date risposte a email o messaggi in altre modalità (tranne che per messaggi che devono rimanere privati, quali richieste legate a DSA). Durante le videolezioni si può usare la chat di Zoom.
  Studenti immatricolati prima del 2019-20
  I contenuti del corso sono cambiati nel 2019-20. Gli studenti immatricolati prima del 2019-20 hanno la facoltà di sostenere l'esame secondo il programma precedente. In questo caso devono contattare il docente titolare del corso durante il loro primo anno di iscrizione per determinare la modalità d'esame.
- Seleziona attività VideolezioniLe videolezioni saranno tenute tramite...
  
  Videolezioni
  Le videolezioni saranno tenute tramite Zoom. Si raccomanda di creare un account e installare il programma per collegarsi con adeguato anticipo e di collegarsi alcuni minuti prima dell'inizio della lezione.
  Per assistere alle videolezioni:https://zoom.us/j/918778000. Tutte le videolezioni saranno registrate e caricate sulla piattaforma di e-learning.
- Seleziona attività Registrazione 10 Marzo
  
  Kaltura Video Resource
  
  Registrazione 10 Marzo Kaltura Video Resource
- Seleziona attività Simulazione di consegna
  
  Kaltura Video Resource
  
  Simulazione di consegna Kaltura Video Resource
- Seleziona attività Indicazioni sulla configurazione di SAS University Edition
  
  Pagina
  
  Indicazioni sulla configurazione di SAS University Edition Pagina
- Seleziona attività Incontro online 1
  
  Kaltura Video Resource
  
  Incontro online 1 Kaltura Video Resource
- Seleziona attività Incontro online 2
  
  Kaltura Video Resource
  
  Incontro online 2 Kaltura Video Resource
- Seleziona attività Incontro 7 Aprile
  
  Kaltura Video Resource
  
  Incontro 7 Aprile Kaltura Video Resource
- Seleziona attività Lezione finale
  
  Kaltura Video Resource
  
  Lezione finale Kaltura Video Resource
- Seleziona attività Dati usati nel corso
  
  Risorsa
  
  Dati usati nel corso File
Seleziona argomento Introduzione al sistema SAS

Introduzione al sistema SAS
- Seleziona attività Periodo: dal  10 Marzo al 23 Marzo
  
  Periodo: dal 10 Marzo al 23 Marzo
- Seleziona attività Lezione Frontale Date:  10/03/2020 - ...
  Lezione Frontale
  
  Date: 10/03/2020 - 11.30-14.30
  
  Luogo: Lab719
  
  Argomento: Introduzione al sistema SAS, Data step e Proc step. Import, Proc print e Proc contents.
- Seleziona attività Board.net
  
  URL
  
  Board.net URL
  
  Lavagna condivisa
- Seleziona attività Dati lezione 1
  
  Risorsa
  
  Dati lezione 1 File
- Seleziona attività Attività Online: Settimana 1
  
  Attività Online: Settimana 1
- Seleziona attività Primo Compito: Lettura dati Turismo in Brasile
  
  Primo Compito: Lettura dati Turismo in Brasile
- Seleziona attività Consegna: Lettura dati Turismo in Brasile
  
  Compito
  
  Consegna: Lettura dati Turismo in Brasile Compito
  Gli studenti dovranno consegnare un breve programma in SAS, su cui non riceveranno feedback.
  Eventuali dubbi o richieste devono essere poste tramite il Forum di questa settimana.
  Leggere il file di dati braziltourism.csv e importarli in un dataset permanente.
- Seleziona attività Secondo Compito: Lettura dati Presenze Baseball
  
  Secondo Compito: Lettura dati Presenze Baseball
- Seleziona attività Consegna: Lettura dati Presenze Baseball
  
  Compito
  
  Consegna: Lettura dati Presenze Baseball Compito
  Gli studenti dovranno consegnare un breve programma in SAS, su cui non riceveranno feedback.
  Eventuali dubbi o richieste devono essere poste tramite il Forum di questa settimana.
  Leggere il file di dati attend.dat e importarli in un dataset permanente.
- Seleziona attività Terzo Compito: Lettura dati produzione grano
  
  Terzo Compito: Lettura dati produzione grano
- Seleziona attività Consegna: Lettura dati produzione grano
  
  Compito
  
  Consegna: Lettura dati produzione grano Compito
  
  Gli studenti dovranno consegnare un breve programma in SAS, su cui non riceveranno feedback.
  Eventuali dubbi o richieste devono essere poste tramite il Forum di questa settimana.
  Leggere il file di dati wheat.txt e importarli in un dataset permanente.
- Seleziona attività Quarto Compito: Lettura dati Pallone aerostatici
  
  Quarto Compito: Lettura dati Pallone aerostatici
- Seleziona attività Forum - Attività Online - Lettura dati Pallone aerostatici
  
  Forum
  
  Forum - Attività Online - Lettura dati Pallone aerostatici
  
  In questo forum è necessario effettuare almeno un intervento in cui si descrive il processo risolutivo applicato, le principali problematiche incontrate e specificare il livello di difficoltà (Basso - Medio - Alto).
- Seleziona attività Consegna: Lettura dati Pallone aerostatici
  
  Compito
  
  Consegna: Lettura dati Pallone aerostatici Compito
  Gli studenti dovranno consegnare un breve programma in SAS, su cui non riceveranno feedback.
  Eventuali dubbi o richieste devono essere poste tramite il Forum di questa settimana.
  Leggere il file di dati balloon.txt e importarli in un dataset permanente.
- Seleziona attività Incontro online 17 Marzo, ore 11.30
  
  URL
  
  Incontro online 17 Marzo, ore 11.30 URL
- Seleziona attività Attività Online: Settimana 2
  
  Attività Online: Settimana 2
- Seleziona attività Quinto Compito: Lettura dati Biometrici
  
  Quinto Compito: Lettura dati Biometrici
- Seleziona attività Consegna: Lettura dati Biometrici
  
  Compito
  
  Consegna: Lettura dati Biometrici Compito
  Gli studenti dovranno consegnare un breve programma in SAS, su cui non riceveranno feedback.
  Eventuali dubbi o richieste devono essere poste tramite il Forum di questa settimana.
  Creare un dataset temporaneo di nome compito con variabili nome, cognome, datanascita, altezza, peso con dati presi da altezze.csv.
  
  Importare i dati in un dataset permanente
  
  Aggiungere una variabile BMI=peso/altezza² , dove l’altezza è in metri e il peso in kg.
  
  Sapendo che 1 pollice = 2.54 centimetri, aggiungere una variabile altezza_pollici che esprime l’altezza in pollici
  
  visualizzare il dataset
  
  Aggiungere una variabile tipo che vale “inferiore” se BMI < 18.5, “normopeso” se BMI è fra 18.5 e 20, “superiore” se BMI è maggiore di 20.
  
  Ottenere un secondo dataset con le sole persone con BMI<20
- Seleziona attività Sesto Compito: Lettura dati Regioni Italiane
  
  Sesto Compito: Lettura dati Regioni Italiane
- Seleziona attività Forum - Attività Online - Lettura dati Regioni Italiane
  
  Forum
  
  Forum - Attività Online - Lettura dati Regioni Italiane
  
  In questo forum è necessario effettuare almeno un intervento in cui si descrive il processo risolutivo applicato, le principali problematiche incontrate e specificare il livello di difficoltà (Basso - Medio - Alto).
- Seleziona attività Consegna: Lettura dati Regioni Italiane
  
  Compito
  
  Consegna: Lettura dati Regioni Italiane Compito
  Gli studenti dovranno consegnare un breve programma in SAS, su cui non riceveranno feedback.
  Eventuali dubbi o richieste devono essere poste tramite il Forum di questa settimana.
  Si utilizzi il file regioni.csv per ottenere i dati grezzi su cui lavorare:
  
  Creare un dataset permanente per tali dati
  
  Dividere i dati in 3 dataset per regioni con meno di 10000 kmq, con oltre 20000 kmq e le rimanenti
  
  Calcolare la densità di ogni regione
  
  Esportare uno dei dataset in un file di testo con dati separati da ;
Seleziona argomento Calcolare statistiche

Calcolare statistiche
- Seleziona attività Periodo: dal  24 Marzo al 6 Aprile
  
  Periodo: dal 24 Marzo al 6 Aprile
- Seleziona attività Lezione Frontale Date:  24/03/2020 - ...
  Lezione Frontale
  
  Date: 24/03/2020 - 11.30-13.30
  
  Luogo: Lab719
  
  Argomento: Discussione esercizio Lettura dati regioni italiane, Le procedure in SAS
- Seleziona attività Soluzione esercizio Regioni
  
  Kaltura Video Resource
  
  Soluzione esercizio Regioni Kaltura Video Resource
- Seleziona attività Proc Print
  
  Kaltura Video Resource
  
  Proc Print Kaltura Video Resource
- Seleziona attività Proc Means parte 1
  
  Kaltura Video Resource
  
  Proc Means parte 1 Kaltura Video Resource
- Seleziona attività Proc Means parte 2
  
  Kaltura Video Resource
  
  Proc Means parte 2 Kaltura Video Resource
- Seleziona attività Fusione dataset
  
  Kaltura Video Resource
  
  Fusione dataset Kaltura Video Resource
- Seleziona attività Proc Freq
  
  Kaltura Video Resource
  
  Proc Freq Kaltura Video Resource
- Seleziona attività ODS
  
  Kaltura Video Resource
  
  ODS Kaltura Video Resource
- Seleziona attività Attività Online: Settimana 3
  
  Attività Online: Settimana 3
- Seleziona attività Settimo Compito: Nascar
  
  Settimo Compito: Nascar
- Seleziona attività Consegna: Nascar
  
  Compito
  
  Consegna: Nascar Compito
  Gli studenti dovranno consegnare un breve programma in SAS, su cui non riceveranno feedback.
  Eventuali dubbi o richieste devono essere poste tramite il Forum di questa settimana.
  Il dataset gareauto contiene l’esito di alcune gare automobilistiche. Lo stato di una gara è Running se il pilota ha completato la gara.
  
  Per ogni pilota, calcolare i punti totali (intesi come somma di punti e bonus) ottenuti.
  
  Per ogni pilota calcolare il numero medio (e deviazione standard) di punti totali ottenuti per ogni gara a cui ha partecipato.
  
  Come il punto precedente, ma solo relativamente alle gare completate.
  
  Per ogni pilota calcolare la somma totale di premi vinti, di giri percorsi e di punti base ottenuti.
- Seleziona attività Soluzione Nascar ( programma SAS)
  
  URL
  
  Soluzione Nascar ( programma SAS) URL
- Seleziona attività Soluzione: Nascar (Video)
  
  Kaltura Video Resource
  
  Soluzione: Nascar (Video) Kaltura Video Resource
- Seleziona attività Ottavo Compito: Dieta
  
  Ottavo Compito: Dieta
- Seleziona attività Forum - Attività Online - Dieta
  
  Forum
  
  Forum - Attività Online - Dieta
  
  In questo forum è necessario effettuare almeno un intervento in cui si descrive il processo risolutivo applicato, le principali problematiche incontrate e specificare il livello di difficoltà (Basso - Medio - Alto).
- Seleziona attività Consegna: Dieta
  
  Compito
  
  Consegna: Dieta Compito
  Gli studenti dovranno consegnare un breve programma in SAS, su cui non riceveranno feedback.
  Eventuali dubbi o richieste devono essere poste tramite il Forum di questa settimana.
  Utilizzando il file dieta.csv nel formato CSV, le cui variabili sono CODICE NOME SQUADRA PESOINIZ PESOFIN ETA SESSO, si calcoli:
  
  Media e deviazione standard del peso alla fine della cura, stratificato per squadra.
  
  Creare un dataset contenente media e deviazione standard rispetto alle squadre, come ottenuto al punto 1.
  
  Modificare il dataset in modo da avere per ogni persona il peso perso, sia in assoluto che in percentuale sul peso iniziale
  
  Il numero di persone che hanno perso almeno il 7% del peso stratificato per sesso (queste persone hanno ottenuto l’obiettivo minimo).
  
  Per ogni squadra la percentuale di pazienti che hanno raggiunto l’obiettivo minimo. Si stampi l’elenco delle squadre in ordine decrescente di percentuale.
  
  Costruire un dataset contenente il numero di persone per squadra che non hanno raggiunto l’obiettivo (le squadre che hanno solo persone che hanno raggiunto l’obiettivo possono essere omesse)
- Seleziona attività Attività Online: Settimana 4
  
  Attività Online: Settimana 4
- Seleziona attività Nono Compito: Auto
  
  Nono Compito: Auto
- Seleziona attività Consegna: Auto
  
  Compito
  
  Consegna: Auto Compito
  Gli studenti dovranno consegnare un breve programma in SAS, su cui non riceveranno feedback.
  Eventuali dubbi o richieste devono essere poste tramite il Forum.
  Si richiede di scrivere un programma SAS per l’analisi dei dati, secondo i seguenti punti. I dati grezzi che si trovano nel file rappresentano dei dati storici riguardanti alcuni dati di vari modelli di auto e sono associabili alle seguenti variabili:
  
  MPG: consumo medio misurato come miglia percorse con un gallone di benzina.
  
  CILINDRI: numero di cilindri del motore.
  
  LUNGHEZZA: lunghezza veicolo (in pollici).
  
  POTENZA: potenza del motore in HP.
  
  PESO: in libbre.
  
  ACCELERAZIONE: tempo (in sec.) per andare da 0 a 60 miglia/ora.
  
  ANNO: anno introduzione modello.
  
  ORIGINE: 1=americana, 2=europea, 3=giapponese.
  
  MODELLO: nome del modello e casa costruttice.
  
  Risolvere i seguenti punti.
  
  Leggere i dati in ingresso e memorizzarli in un dataset SAS permanente.
  
  Tenendo conto che 1 miglio = 1.60935 km e 1 gallone = 4.4 litri, esprimere il consumo medio con litri necessari per percorrere 100 km.
  
  Calcolare media, deviazione standard e skewness della variabile POTENZA stratificata per ANNO.
  
  Costruire una tabella a 2 entrate i cui assi rappresentino l’origine del costruttore l’anno di introduzione del modello, e il dato in ogni cella del dataset deve essere il numero di modelli introdotti nell’anno da un costruttore con determinata origine. Nella tabella devono essere presenti le varie ripartizioni percentuali. Ad esempio nella cella con etichetta (72,2) si troverà il numero di modelli introdotti nel 1972 da costruttori europei, inoltre nella tabella si deve avere la percentuale di modelli introdotti nel 1972.
- Seleziona attività Soluzione esercizio Auto (Video)
  
  Kaltura Video Resource
  
  Soluzione esercizio Auto (Video) Kaltura Video Resource
- Seleziona attività Decimo Compito: Emergenze
  
  Decimo Compito: Emergenze
- Seleziona attività Consegna: Emergenze (parte 1)
  
  Compito
  
  Consegna: Emergenze (parte 1) Compito
  Gli studenti dovranno consegnare un breve programma in SAS, su cui non riceveranno feedback.
  Eventuali dubbi o richieste devono essere poste tramite il Forum.
  Il file FEMA2.csv contiene i dati relativi ad alcuni interventi eseguiti in seguito ad alcune emergenze negli Stati Uniti. I nomi di variabili sono contenuti nella prima riga del file.
  
  Leggere i dati in ingresso e memorizzarli in un data set SAS permanente.
  
  Salvare, in un dataset temporaneo, solo le prime 3 variabili del data set letto. Stampare le osservazioni dello stato Texas del dataset originale, visualizzando la data nel formato europeo (prima il giorno e dopo il mese) e 0 o 1 a seconda che il proponente sia nel campo dell’istruzione o meno.
  
  Calcolare media, massimo e minimo della variabile Amount (che rappresenta lo stanziamento) stratificata per County.
  
  Ripetere il punto precedente solo sulle osservazioni dell’anno 2008.
  
  Creare un nuovo dataset temporaneo contenente solo le osservazioni relative allo Stato del Texas. Nel nuovo dataset creare una nuova variabile StanziamentoMedio che contiene il rapporto fra i fondi stanziati e il numero di progetti.
- Seleziona attività Forum - Attività Online - Emergenze
  
  Forum
  
  Forum - Attività Online - Emergenze
  
  In questo forum è necessario effettuare almeno un intervento in cui si descrive il processo risolutivo applicato, le principali problematiche incontrate e specificare il livello di difficoltà (Basso - Medio - Alto).
- Seleziona attività Consegna: Emergenze (parte 2)
  
  Compito
  
  Consegna: Emergenze (parte 2) Compito
  Determinare quale stato ha ricevuto la quantità maggiore di fondi totali (quindi bisogna determinare per ogni stato il totale dei fondi ricevuti).
  
  Determinare come i fondi siano stati ripartiti, sia in valore assoluto che in percentuale, rispetto allo stato e al fatto che il richiedente sia nel campo dell’istruzione.
  
  Creare un nuovo data set con i risultati ottenuti al punto precedente.
  
  Leggere il file di dati FEMA2.txt contenente, per ogni tipologia di emergenza, un valore di severità associato.
  
  Fondere il nuovo dataset con quello originale.
- Seleziona attività Incontro online 7 Aprile, ore 11.30. Discussione esercizio emergenze
  
  URL
  
  Incontro online 7 Aprile, ore 11.30. Discussione esercizio emergenze URL

ODS, Fusione dataset

Seleziona attività Periodo: dal  7 Aprile al 21 Aprile (copia) (copia)

Periodo: dal 7 Aprile al 21 Aprile
Seleziona attività Attività Online: Settimana 5

Attività Online: Settimana 5
Seleziona attività Undicesimo Compito: Elezioni

Undicesimo Compito: Elezioni

Compito

Consegna: Elezioni Compito

Gli studenti dovranno consegnare un breve programma in SAS, su cui non riceveranno feedback.

Si analizzino i dati del file fl2000.csv, rappresentati i voti espressi in Florida nell’elezione presidenziale del 2000. Le variabili sono: county, technology, columns, numero, oltre ad codice che indica se si tratta di schede bianche, nulle o assegnate ad uno dei candidati, secondo la seguente tabella.

codice	significato
1	schede bianche
2	schede nulle
3	Bush
4	Gore
5	Browne
6	Nader
7	Harris
8	Hagelin
9	Buchanan
10	McReynolds
11	Phillips
12	Moorehead
13	Chote
14	McCharthy

Ad esempio, la riga

Alachua,Optical,1,5,658

indica che nella contea Alachua con metodo Optical e dove la scheda ha 1 colonna, il candidato Browne ha ottenuto 658 voti.

Calcolare il numero totale di voti raccolti da ogni candidato (escluse schede bianche e nulle).
Calcolare la percentuale di voti raccolti da ogni candidato (escluse schede bianche e nulle).
Per ogni contea, determinare il candidato che ha ottenuto il numero massimo di voti.
Calcolare il numero totale di voti per candidato distinto per tipo di colonne nella scheda (columns) e modalità di conteggio (technology). Rappresentare le informazioni in due tabelle (una per columns, una per technology).
Aggiungere al dataset una variabile che contenga i voti non validi (intesi come somma del numero di schede bianche e del numero di schede nulle). Determinare in quale contea si è verificato il numero massimo di voti non validi. ? Determinare in quale contea si è verificata la percentuale più elevata di voti non validi rispetto al numero totale di voti.
Determinare il numero di contee in cui i voti attribuiti al candidato Nader sono stati almeno il 2% dei voti validi (quindi escludendo le schede bianche o nulle).

Seleziona attività Dodicesimo Compito: Satelliti

Dodicesimo Compito: Satelliti
Seleziona attività Forum - Attività Online - Satelliti

Forum

Forum - Attività Online - Satelliti

In questo forum è necessario effettuare almeno un intervento in cui si descrive il processo risolutivo applicato, le principali problematiche incontrate e specificare il livello di difficoltà (Basso - Medio - Alto).
Seleziona attività Consegna: Satelliti

Compito

Consegna: Satelliti Compito
Gli studenti dovranno consegnare un breve programma in SAS, su cui non riceveranno feedback.
Eventuali dubbi o richieste devono essere poste tramite il Forum di questa settimana.
Scrivere un programma SAS per l’analisi dei dati presenti nel file satellite.txt, secondo i seguenti punti. I dati grezzi che si trovano nel file rappresentano i risultati di prove di alcuni prodotti elettronici. I dati sono associabili alle seguenti variabili:

PRODOTTO: il nome del prodotto a cui si riferisce l’osservazione.

NUMSATELLITE: numero progressivo del satellite a cui si riferisce l’osservazione.

ALTITUDINE: altitudine rilevata per il satellite.

AZIMUTH: azimuth rilevata per il satellite.

MEDIO: valore medio del rapporto segnale/rumore (SNR) rilevato.

MINIMO: valore minimo del rapporto segnale/rumore (SNR) rilevato.

MASSIMO: valore massimo del rapporto segnale/rumore (SNR) rilevato.

Risolvere i seguenti punti.

Leggere i dati in ingresso e memorizzarli in un dataset SAS temporaneo.

Calcolare il valore medio di altitudine e azimuth stratificato per satellite (variabile NUMSATELLITE).

Calcolare media, deviazione standard e skewness della variabile minimo.

Aggiungere al dataset una variabile SCARTO che contenga la differenza fra MASSIMO e MINIMO.

Calcolare, per ogni satellite, il valore medio della variabile scarto, e stampare i satelliti in ordine crescente di tale valore medio.

Aggiungere al dataset iniziale una variabile di nome ALTITUDINE_MEDIA contenente i dati ottenuti al punto 2 relativi alla variabile ALTITUDINE. Notare che lo stesso valore deve essere aggiunto a tutte le osservazioni che si riferiscono allo stesso satellite.
Seleziona attività Incontro online 17 Aprile, ore 11.30

URL

Incontro online 17 Aprile, ore 11.30 URL
Seleziona attività Registrazione Incontro online 17/4

Kaltura Video Resource

Registrazione Incontro online 17/4 Kaltura Video Resource
Seleziona attività Attività Online: Settimana 6

Attività Online: Settimana 6
Seleziona attività Tredicesimo Compito: Vento

Tredicesimo Compito: Vento
Seleziona attività Consegna: Vento

Compito

Consegna: Vento Compito
Gli studenti dovranno consegnare un breve programma in SAS, su cui non riceveranno feedback.
Eventuali dubbi o richieste devono essere poste tramite il Forum di questa settimana.
Si richiede di scrivere un programma SAS per l’analisi dei dati secondo i seguenti punti.

I dati grezzi che si trovano nel file rappresentano le velocità medie del vento registrate dal 1961 al 1978 in alcune stazioni metereologiche, nel seguente formato: ANNO, MESE, GIORNO, poi seguono le rilevazioni (per il giorno in esame) delle 12 stazioni metereologiche.

Leggere i dati in ingresso e memorizzarli in un dataset SAS permanente.

Determinare, tramite una analisi delle frequenze, il numero di rilevazioni effettuate dalla prima stazione per ogni anno.

Calcolare per ogni stazione il valore medio rilevato. Quale ha ottenuto il valore minimo?

Costruire una tabella a 2 entrate in cui su un asse sono rappresentati gli anni e sull’altro asse sono rappresentate le stazioni metereologiche. Ogni cella della tabella deve essere la somma delle velocità rilevate dalla stazione nell’anno in esame.

Dalla tabella a 2 entrate calcolata al punto 5, estrarre i casi (anno e stazione) relativi a valori percentuali maggiori del 0,6%. Nel risultato non devono comparire dati riepilogativi di righe o colonne (ovvero, sia anno che stazioni non devono essere mancanti).
Seleziona attività Tredicesimo Compito: Giappone

Tredicesimo Compito: Giappone
Seleziona attività Consegna: Giappone

Compito

Consegna: Giappone Compito
Gli studenti dovranno consegnare un breve programma in SAS, su cui non riceveranno feedback.
Eventuali dubbi o richieste devono essere poste tramite il Forum di questa settimana.
Si richiede di scrivere un programma SAS per l’analisi dei dati presenti nel file japan.zip secondo i punti che seguono.

I dati grezzi che si trovano nel file japan.csv riportano alcune rilevazioni relative ai livelli di radioattività misurati in Giappone nel periodo 9/3/2011 – 16/4/2011. Ogni osservazione è relativa ad una misurazione e le variabili sono presenti nella prima riga del file. Il file StationLocations.csv contiene id dati identificativi delle varie stazioni di rilevazione.

Leggere i dati del file in ingresso e memorizzarli in un dataset SAS permanente, tenendo conto che valori negativi di SA e RA corrispondono a dati mancanti.

Calcolare media, massimo e deviazione standard della variabile RA stratificata per STATION_COD.

Determinare come le precipitazioni rilevate (RA) siano distribuite rispetto ai vari giorni di rilevazione.

Creare un nuovo dataset temporaneo contenente solo le osservazioni relative a radiazioni (SA) non mancanti.
Seleziona attività Consegna: Giappone (parte 2)

Compito

Consegna: Giappone (parte 2) Compito
Gli studenti dovranno consegnare un breve programma in SAS, su cui non riceveranno feedback.
Eventuali dubbi o richieste devono essere poste tramite il Forum di questa settimana.
Calcolare le precipitazioni medie rilevate in ogni giorno/stazione, emettendo il risultato in un nuovo dataset. Il nuovo dataset dovrebbe quindi avere variabili GIORNO, STAZIONE, RA_MEDIA.
In quale stazione è stato rilevato il minimo valore di RA_MEDIA nel punto precedente?
Per ogni stazione determinare la media della variabile SA relativamente alle osservazioni con data fino al 11/3/2011.
Aggiungere al dataset una variabile INCREMENTO_SA ottenuta come differenza fra SA e la media di SA ottenuta al punto precedente. La variabile INCREMENTO_SA deve avere valore mancante in tutte le osservazioni fino al 11/3/2011.
Seleziona attività Consegna: Giappone (parte 3)

Compito

Consegna: Giappone (parte 3) Compito
Gli studenti dovranno consegnare un breve programma in SAS, su cui non riceveranno feedback.
Eventuali dubbi o richieste devono essere poste tramite il Forum di questa settimana.
Leggere i dati del file StationLocations.csv e memorizzarli in un dataset SAS permanente. Notare che in questo file le stazioni hanno una variabile STATION_ID che è un numero progressivo che inizia con 1.

Nel dataset otttenuto al punto precedente aggiungere una variabile DISTANZA_Q che contiene il quadrato della distanza dal punto con latitudine 37.422972 e longitudine 141.032917, ottenuta applicando la formula 80²(latitudine - 37.422972)² + 111²(longitudine - 141.032917)²

Per ogni sito (SITE_ID), determinare il numero di stazioni presenti.

Fondere i due dataset contenenti i due file di dati grezzi letti, sfruttando la condivisione della variabile STATION_COD.
Seleziona attività Soluzione esercizio Giappone (video)

Kaltura Video Resource

Soluzione esercizio Giappone (video) Kaltura Video Resource
Seleziona attività Lezione Frontale Date:  21/04/2020 - ...
Lezione Frontale

Date: 21/04/2020 - 11:30-13:30

Luogo: Lab719

Argomento: Riepilogo SAS. Introduzione a R.
Seleziona attività Simulazione esame (Multe)

Compito

Simulazione esame (Multe) Compito
Si richiede di scrivere un programma SAS per l’analisi dei dati presenti nei file multe.csv e codici.csv secondo i punti che seguono.
Leggere i dati del file multe.csv in un dataset permanente. Se non specificato, ogni operazione deve essere eseguita su tale dataset. Ogni osservazione corrisponde ad una multa comminata. Le variabili sono presenti nel file.
Controllare se sono presenti valori mancanti.
Creare una nuova variabile ANNO ottenuta prendendo la parte intera di MARKED TIME diviso 100.
Costruire un nuovo dataset permanente che contiene le osservazioni dove RP STATE PLATE è diverso da CA.
Calcolare media, minimo e deviazione standard di FINE AMOUNT stratificato per RP STATE PLATE.
Individuare quale RP STATE PLATE ha avuto il valore medio di FINE AMOUNT (calcolato al punto precedente) più basso.
Indicare, sia in valore assoluto che in percentuale, come il numero di multe sia ripartito fra i vari tipi di infrazione (VIOLATION DESCRIPTION).
Emettere i risultati del punto precedente in un nuovo dataset temporaneo.
Leggere i dati del file codici.csv in un dataset temporaneo.
Fondere i dataset al punto precedente con quello originale, sfruttando il campo AGENCY.
Seleziona attività Soluzione Multe

Kaltura Video Resource

Soluzione Multe Kaltura Video Resource

Indice degli argomenti

Introduzione

Risorse su SAS

Organizzazione del corso

Videolezioni

Introduzione al sistema SAS

Periodo: dal 10 Marzo al 23 Marzo

Lezione Frontale

Attività Online: Settimana 1

Primo Compito: Lettura dati Turismo in Brasile

Secondo Compito: Lettura dati Presenze Baseball

Terzo Compito: Lettura dati produzione grano

Quarto Compito: Lettura dati Pallone aerostatici

Attività Online: Settimana 2

Quinto Compito: Lettura dati Biometrici

Sesto Compito: Lettura dati Regioni Italiane

Calcolare statistiche

Periodo: dal 24 Marzo al 6 Aprile

Lezione Frontale

Attività Online: Settimana 3

Settimo Compito: Nascar

Ottavo Compito: Dieta

Attività Online: Settimana 4

Nono Compito: Auto

Decimo Compito: Emergenze

ODS, Fusione dataset

Periodo: dal 7 Aprile al 21 Aprile

Attività Online: Settimana 5

Undicesimo Compito: Elezioni

Dodicesimo Compito: Satelliti

Attività Online: Settimana 6

Tredicesimo Compito: Vento

Tredicesimo Compito: Giappone

Lezione Frontale