Skip to main content
If you continue browsing this website, you agree to our policies:
  • Condizioni di utilizzo e trattamento dei dati
Continue
x
e-Learning - UNIMIB
  • Home
  • My Media
  • More
Listen to this page using ReadSpeaker
English ‎(en)‎
English ‎(en)‎ Italiano ‎(it)‎
 Log in
e-Learning - UNIMIB
Home My Media
Percorso della pagina
  1. Economics
  2. Master Degree
  3. Scienze Statistiche ed Economiche [F8206B - F8204B]
  4. Courses
  5. A.A. 2026-2027
  6. 1st year
  1. Sampling Methods M
  2. Summary
Insegnamento Course full name
Sampling Methods M
Course ID number
2627-1-F8206B005
Course summary SYLLABUS

Course Syllabus

  • Italiano ‎(it)‎
  • English ‎(en)‎
Export

Obiettivi formativi

Questo corso si propone di introdurre gli strumenti fondamentali della teoria dei campioni necessari per l’inferenza da popolazioni finite. Nella prima parte del corso verranno analizzati i più importanti piani di campionamento probabilistici e verranno definite diverse tipologie di stimatori per i caratteri di interesse della popolazione. Nella seconda parte del corso, verranno discusse alcune applicazioni, in particolare verranno affrontate le tecniche più moderne per la privatizzazione dei dati. Gli obiettivi formativi del corso sono fondamentali per l'area Statistica. Il corso contribuisce a consolidare le capacità di apprendimento e di aggiornamento nell’ambito dei metodi avanzati di inferenza statistica e della teoria dei campioni, in coerenza con l’area di apprendimento "Statistica" del corso di laurea magistrale in Scienze Statistiche ed Economiche.

Contenuti sintetici

La prima parte del corso intende fornire agli studenti una solida base teorica dei metodi di campionamento da popolazioni finite. In particolare verranno presentati diversi piani di campionamento: casuale semplice, stratificato, sistematico, a grappoli, multistadiale, piani di campionamento non probabilistici. Contestualmente saranno introdotte diverse tipologie di stimatori per totali, medie e proporzioni, tra cui gli stimatori quoziente e per regressione. Nella seconda parte del corso verrà analizzato il metodo delle risposte casualizzate, il problema della privatizzazione dei dati (in particolare il concetto di differential privacy). Verrà introdotto il concetto di indice di disclosure (divulgazione) per quantificare la rischiosità di ledere la riservatezza dei dati forniti dal rispondente quando essi vengono pubblicati da un ufficio statistico. Il corso prevede lezioni teoriche ed esercizi svolti in aula.

Programma esteso

  1. INTRODUZIONE AL CORSO E NOZIONI DI BASE
    La differenza tra indagini campionarie e censuarie. Cenni storici sulle indagini campionarie. Il concetto di indagine statistica, popolazione, campione, caratteri. Lo spazio campionario e la nozione di piano di campionamento. I campionamenti non probabilistici.

  2. CAMPIONAMENTO CASUALE SEMPLICE SENZA RIPETIZIONE
    Lo stimatore di Horvitz-Thompson del totale e della media nel campionamento casuale semplice senza ripetizione. Calcolo della varianza dello stimatore e stima corretta della varianza. Cenni al Teorema di Hàjek (senza dimostrazione) e alla costruzione di intervalli di confidenza asintotici per medie e totali. Gli stimatori per le proporzioni. Il problema della stima della dimensione campionaria nel campionamento casule semplice.

  3. CAMPIONAMENTO CASUALE SEMPLICE CON RIPETIZIONE
    Lo stimatore di Hansen-Hurwitz del totale e della media: derivazione generale dello stimatore nel caso di probabilità di estrazione variabili. Analisi degli stimatori per il campionamento casuale semplice con ripetizione: varianza dello stimatore e stima corretta della varianza. Il concetto di design effect.

  4. CAMPIONAMENTI A PROBABILITA' VARIABILI
    Calcolo della varianza per lo stimatore di Hansen-Hurwitz. Calcolo della varianza per lo stimatore di Horvitz-Thompson.
    Il concetto di misure d'ampiezza. Diversi metodi di campionamento a probabilità variabili.

  5. CAMPIONAMENTO STRATIFICATO
    IL concetto di stratificazione. Stimatori della media e del totale nel campionamento stratificato. Stratificazione con allocazione proporzionale e allocazione ottima delle unità. La poststratificazione.

  6. STIMATORE RAPPORTO
    L'uso delle variabili ausiliarie per definire stimatori più efficienti. Lo stimatore rapporto: definizione, approssimazione della varianza mediante linearizzazione, confronto con il campionamento casuale semplice. Lo stimatore rapporto nel campionamento stratificato: stimatore quoziente combinato e separato.
    Lo stimatore per regressione: definizione, analisi della varianza.

  7. CAMPIONAMENTO A GRAPPOLI
    Il piano di campionamento a grappoli: generalità. Lo stimatore corretto del totale e lo stimatore quoziente nel campionamento a grappoli. Analisi della varianza dello stimatore: variabilità nei grappoli, variabilità tra i grappoli, variabilità complessiva della popolazione, indice di omogeneità nei grappoli. Efficienza dello stimatore in funzione dell'indice di omogeneità nei grappoli. Il campionamento sistematico come caso particolare del campionamento a grappoli.

  8. APPLICAZIONI
    La valutazione del rischio associato alla divulgazione dei dati a fini statistici, alcuni metodi di privatizzazione dei dati (differential privacy e tecnica delle risposte randomizzate. Metodo di Warner e Metodo di Simmons). Diversi indici per misurare il rischio nella divulgazione dei dati, quando essi sono nella forma di tabelle di frequenze.

Prerequisiti

Per seguire in modo proficuo il corso di Metodi per le Indagini Campionarie si consiglia la conoscenza degli argomenti trattati nei corsi di Analisi Matematica e Statistica a livello di una laurea triennale in Statistica.

Metodi didattici

Sono previste circa 40 ore di lezioni frontali, in cui verranno affrontati numerosi esempi ed esercizi. Le lezioni saranno svolte in modalità erogativa in presenza.

Modalità di verifica dell'apprendimento

L’esame è costituito da una prova scritta, l'orale è facoltativo. La prova scritta è costituita da esercizi e da alcune domande di teoria. Gli esercizi mirano ad accertare la comprensione degli argomenti trattati e la capacità dello studente di sfruttare gli strumenti di teoria dei campioni per risolvere problemi concreti. Le domande di teoria servono a verificare la conoscenza dei concetti di base di teoria dei campioni.

L'orale è facoltativo e può essere chiesto sia dallo studente che dal docente. L'esame orale verte su tutto il programma del corso e deve essere svolto pochi giorni dopo lo scritto, in base alle disponibilità del docente. In tal caso il voto finale è una media della prova scritta e della prova orale.

Durante lo scritto è consentito l'uso della calcolatrice scientifica, ma non è ammesso l'uso di appunti, libri e strumenti tecnologici. Verrà fornito un formulario.

Testi di riferimento

Per la prima parte del corso consigliano i seguenti testi:

  1. P.L. Conti, D. Marella. Campionamento da popolazioni finite. Springer-Verlag Mailand, 2012.

  2. S. Thompson. Sampling. Wiley, 2012.

Per la seconda parte del corso (divulgazione dei dati a fini statistici e valutazione del rischio)

  1. Articoli indicati dal docente durante il corso

  2. Dwork, C., Roth A. The Algorithmic foundations of Differential Privacy. 2014.

Periodo di erogazione dell'insegnamento

Il corso verrà erogato nel secondo semestre, primo ciclo.

Lingua di insegnamento

L'insegnamento è erogato in lingua italiana.

Sustainable Development Goals

ISTRUZIONE DI QUALITÁ
Export

Learning objectives

This course aims at providing the students with all the necessary notions to face statistical inference for finite populatins. In the first part of the course, the teacher will introduce the most important sampling schemes for finite populations and he will define different kinds of estimators for means/totals. In the last part of the course some important applications will be discussed, with a special focus on the most recent techniques to privatize a dataset. The learning objectives of the course mainly refer to Statistics. In particular, the course contributes to strengthening the ability to learn in the field of of advanced inference methods, in line with the "Statistics" area of the Master degree's program in Scienze Statistiche ed Economiche.

Contents

The first part of the course aims at providing the students with a solid theoretical background to face statistical inference for finite populations. More precisely the most important sampling schemes will be analyzed: simple random sampling, stratified, systematic, cluster sampling, multi-stage design, etc. Besides different kinds of estimators for means, totals and proportions will be defined and studied, among them we consider the ratio and regression estimators. In the second part of the course, some applications will be analyzed, among which the randomized response techinque, disclosure risk assessment and differential privacy. The course includes lessons and exercises.

Detailed program

  1. INTRODUCTION AND BASIC NOTIONS
    Historical background, the difference between a sample survy and a census. The notion of population, sample, variable. The underlying probability space in a sample survy and the notion of sampling design. Non-probabilistic sampling schemes.

  2. SIMPLE RANDOM SAMPLING WITHOUT REPLACEMENT
    The Horvitz-Thompson estimator for the total for simple random sampling without replacement. Evaluation of the variance and the unbiased estimator. Hàjek theorem (without proof) and the construction of asymptotic confidence intervals. Estimators for means and proportions. The problem of sample size in simple random sampling.

  3. SIMPLE RANDOM SAMPLING WITH REPLACEMENT
    The Hansen-Hurwitz estimator: derivation in the general case. Analysis of the estimator for simple random sampling with replacement. The notion of design effect.

  4. VARYING PROBABILITY SAMPLING

The variance of the Hansen-Hurwitz and the Horvitz-Thompson estimator. The notion of auxiliary variable. Different sampling schemes with varying probabilities.

  1. STRATIFIED SAMPLING

The definition of the sampling scheme. Estimators for mean, total in the stritified sampling scheme.
Optimum and proportional allocation. Poststratification.

  1. RATIO ESTIMATOR
    The use of auxiliary variables for defining different and more efficient estimators. The ratio estimator: definition, the method of linearization to estimate the variance, comparision with simple random sampling.
    Ratio estimator for stratified random sampling.
    Regression estimator: definition, variance.

  2. CLUSTER SAMPLING
    Cluster sampling: basic properties. The unbiased estimator and the ratio estimator in cluster sampling. The analysis of variance: variability within and across clusters, total variability of the population, the index of homogeneity within clusters.

  3. APPLICATIONS
    Disclosure risk assessment. Randomized response techniques. Differential Privacy.

Prerequisites

It is recommended the knowledge of the arguments of Mathematical Analysis and Statistics, taught during a bachelor degree in Statistics or similar fields.

Teaching methods

Approximately 40 hours of lectures, during which numerous examples and exercises will be covered. The lectures will be delivered in person.

Assessment methods

The exam is written, the oral test is not mandatory. In the written test, the student is asked to solve exercises and to answer some questions concerning sampling methods.

The oral test is optional, and it may be requested by the student or by the instructor some days after the written test. The oral exam will focus on questions of the theory developed during the course.

During the written exam, the use of a scientific calculator is allowed, but notes, books, and technological devices are not permitted. A form including most formulas will be provided.

Textbooks and Reading Materials

As for the first part, the following books are recommended:

  1. P.L. Conti, D. Marella. Campionamento da popolazioni finite. Springer-Verlag Mailand, 2012.

  2. S. Thompson. Sampling. Wiley, 2012.

As for the second part (disclosure risk assessment and differential privacy):

  1. Papers suggested during the course.

  2. Dwork, C., Roth A. The Algorithmic foundations of Differential Privacy. 2014.

Semester

Spring semester.

Teaching language

Italian

Sustainable Development Goals

QUALITY EDUCATION
Enter

Key information

Field of research
STAT-01/A
ECTS
6
Term
Second semester
Activity type
Mandatory to be chosen
Course Length (Hours)
42
Degree Course Type
2-year Master Degree
Language
Italian

Staff

    Teacher

  • AG
    Andrea Gilardi

Students' opinion

View previous A.Y. opinion

Bibliography

Find the books for this course in the Library

Enrolment methods

Manual enrolments

Sustainable Development Goals

QUALITY EDUCATION - Ensure inclusive and equitable quality education and promote lifelong learning opportunities for all
QUALITY EDUCATION

You are not logged in. (Log in)
Policies
Get the mobile app
Powered by Moodle
© 2026 Università degli Studi di Milano-Bicocca
  • Privacy policy
  • Accessibility
  • Statistics