Insegnamento
Titolo del corso
Laboratorio di Informatica (blended)
Codice identificativo del corso
1920-1-E4102B004
Simulazione esame (Multe)
Aggregazione dei criteri
Consegnare
Aperto: sabato, 11 aprile 2020, 00:00
Data limite: sabato, 18 aprile 2020, 00:00
Si richiede di scrivere un programma SAS per l’analisi dei dati presenti nei file multe.csv e codici.csv secondo i punti che seguono.
- Leggere i dati del file multe.csv in un dataset permanente. Se non specificato, ogni operazione deve essere eseguita su tale dataset. Ogni osservazione corrisponde ad una multa comminata. Le variabili sono presenti nel file.
- Controllare se sono presenti valori mancanti.
- Creare una nuova variabile ANNO ottenuta prendendo la parte intera di MARKED TIME diviso 100.
- Costruire un nuovo dataset permanente che contiene le osservazioni dove RP STATE PLATE è diverso da CA.
- Calcolare media, minimo e deviazione standard di FINE AMOUNT stratificato per RP STATE PLATE.
- Individuare quale RP STATE PLATE ha avuto il valore medio di FINE AMOUNT (calcolato al punto precedente) più basso.
- Indicare, sia in valore assoluto che in percentuale, come il numero di multe sia ripartito fra i vari tipi di infrazione (VIOLATION DESCRIPTION).
- Emettere i risultati del punto precedente in un nuovo dataset temporaneo.
- Leggere i dati del file codici.csv in un dataset temporaneo.
- Fondere i dataset al punto precedente con quello originale, sfruttando il campo AGENCY.