Section outline

  • Calcolare statistiche

    • Periodo: dal  24 Marzo al 6 Aprile

    • Lezione Frontale

      • Date:  24/03/2020 - 11.30-13.30 
      • Luogo: Lab719
      • Argomento:  Discussione esercizio Lettura dati regioni italiane, Le procedure in SAS
    • Kaltura Video Resource
    • Kaltura Video Resource
    • Attività Online: Settimana 3

    • Settimo Compito: Nascar
    • Gli studenti dovranno consegnare un breve programma in SAS, su cui non riceveranno feedback.
      Eventuali dubbi o richieste devono essere poste tramite il Forum di questa settimana.

      Il dataset gareauto contiene l’esito di alcune gare automobilistiche. Lo stato di una gara è Running se il pilota ha completato la gara.

      1. Per ogni pilota, calcolare i punti totali (intesi come somma di punti e bonus) ottenuti.
      2. Per ogni pilota calcolare il numero medio (e deviazione standard) di punti totali ottenuti per ogni gara a cui ha partecipato.
      3. Come il punto precedente, ma solo relativamente alle gare completate.
      4. Per ogni pilota calcolare la somma totale di premi vinti, di giri percorsi e di punti base ottenuti.

    • URL
      Soluzione Nascar ( programma SAS) URL
    • Kaltura Video Resource
      Soluzione: Nascar (Video) Kaltura Video Resource
    • Ottavo Compito: Dieta
    • In questo forum è necessario effettuare almeno un intervento in cui si descrive il processo risolutivo applicato, le principali  problematiche incontrate e specificare il livello di difficoltà (Basso - Medio - Alto).

    • Gli studenti dovranno consegnare un breve programma in SAS, su cui non riceveranno feedback.
      Eventuali dubbi o richieste devono essere poste tramite il Forum di questa settimana.

      Utilizzando il file dieta.csv nel formato CSV, le cui variabili sono CODICE NOME SQUADRA PESOINIZ PESOFIN ETA SESSO, si calcoli:

      1. Media e deviazione standard del peso alla fine della cura, stratificato per squadra.
      2. Creare un dataset contenente media e deviazione standard rispetto alle squadre, come ottenuto al punto 1.
      3. Modificare il dataset in modo da avere per ogni persona il peso perso, sia in assoluto che in percentuale sul peso iniziale
      4. Il numero di persone che hanno perso almeno il 7% del peso stratificato per sesso (queste persone hanno ottenuto l’obiettivo minimo).
      5. Per ogni squadra la percentuale di pazienti che hanno raggiunto l’obiettivo minimo. Si stampi l’elenco delle squadre in ordine decrescente di percentuale.
      6. Costruire un dataset contenente il numero di persone per squadra che non hanno raggiunto l’obiettivo (le squadre che hanno solo persone che hanno raggiunto l’obiettivo possono essere omesse)

    • Attività Online: Settimana 4

    • Nono Compito: Auto
    • Gli studenti dovranno consegnare un breve programma in SAS, su cui non riceveranno feedback.
      Eventuali dubbi o richieste devono essere poste tramite il Forum.

      Si richiede di scrivere un programma SAS per l’analisi dei dati, secondo i seguenti punti. I dati grezzi che si trovano nel file rappresentano dei dati storici riguardanti alcuni dati di vari modelli di auto e sono associabili alle seguenti variabili:

      • MPG: consumo medio misurato come miglia percorse con un gallone di benzina.
      • CILINDRI: numero di cilindri del motore.
      • LUNGHEZZA: lunghezza veicolo (in pollici).
      • POTENZA: potenza del motore in HP.
      • PESO: in libbre.
      • ACCELERAZIONE: tempo (in sec.) per andare da 0 a 60 miglia/ora.
      • ANNO: anno introduzione modello.
      • ORIGINE: 1=americana, 2=europea, 3=giapponese.
      • MODELLO: nome del modello e casa costruttice.

      Risolvere i seguenti punti.

      1. Leggere i dati in ingresso e memorizzarli in un dataset SAS permanente.
      2. Tenendo conto che 1 miglio = 1.60935 km e 1 gallone = 4.4 litri, esprimere il consumo medio con litri necessari per percorrere 100 km.
      3. Calcolare media, deviazione standard e skewness della variabile POTENZA stratificata per ANNO.
      4. Costruire una tabella a 2 entrate i cui assi rappresentino l’origine del costruttore l’anno di introduzione del modello, e il dato in ogni cella del dataset deve essere il numero di modelli introdotti nell’anno da un costruttore con determinata origine. Nella tabella devono essere presenti le varie ripartizioni percentuali. Ad esempio nella cella con etichetta (72,2) si troverà il numero di modelli introdotti nel 1972 da costruttori europei, inoltre nella tabella si deve avere la percentuale di modelli introdotti nel 1972.

    • Kaltura Video Resource
      Soluzione esercizio Auto (Video) Kaltura Video Resource
    • Decimo Compito: Emergenze
    • Gli studenti dovranno consegnare un breve programma in SAS, su cui non riceveranno feedback.
      Eventuali dubbi o richieste devono essere poste tramite il Forum.

      Il file FEMA2.csv contiene i dati relativi ad alcuni interventi eseguiti in seguito ad alcune emergenze negli Stati Uniti. I nomi di variabili sono contenuti nella prima riga del file.

      1. Leggere i dati in ingresso e memorizzarli in un data set SAS permanente.
      2. Salvare, in un dataset temporaneo, solo le prime 3 variabili del data set letto. Stampare le osservazioni dello stato Texas del dataset originale, visualizzando la data nel formato europeo (prima il giorno e dopo il mese) e 0 o 1 a seconda che il proponente sia nel campo dell’istruzione o meno.
      3. Calcolare media, massimo e minimo della variabile Amount (che rappresenta lo stanziamento) stratificata per County.
      4. Ripetere il punto precedente solo sulle osservazioni dell’anno 2008.
      5. Creare un nuovo dataset temporaneo contenente solo le osservazioni relative allo Stato del Texas. Nel nuovo dataset creare una nuova variabile StanziamentoMedio che contiene il rapporto fra i fondi stanziati e il numero di progetti.

    • In questo forum è necessario effettuare almeno un intervento in cui si descrive il processo risolutivo applicato, le principali  problematiche incontrate e specificare il livello di difficoltà (Basso - Medio - Alto).

      1. Determinare quale stato ha ricevuto la quantità maggiore di fondi totali (quindi bisogna determinare per ogni stato il totale dei fondi ricevuti).
      2. Determinare come i fondi siano stati ripartiti, sia in valore assoluto che in percentuale, rispetto allo stato e al fatto che il richiedente sia nel campo dell’istruzione.
      3. Creare un nuovo data set con i risultati ottenuti al punto precedente.
      4. Leggere il file di dati FEMA2.txt contenente, per ogni tipologia di emergenza, un valore di severità associato.
      5. Fondere il nuovo dataset con quello originale.