Le fonti dei dati

Studi che utilizzano l’analisi statistica dipendono fortemente dalla disponibilità di dati, o di risorse per raccogliere dati Vediamo ora dove cercare e trovare i dati. Ma quali dati? Tipicamente, i dati che servono a rispondere precisamente ad un problema di ricerca non ci sono.

Quali sono i tipi principali di dati?

È utile conoscere quali tipi di dati possono essere utilizzati per le analisi statistiche. Di seguito riportiamo alcune classificazioni utili nell’ambito delle analisi economiche e sociali (senza pretesa di esaustività).

DATI SPERIMENTALI

È possibile disegnare la raccolta dati in modo sperimentale. Gli esperimenti sono però rari nelle scienze economiche e sociali, anche se sono molto diffusi in psicologia e nelle applicazioni della psicologia sociale (ad es. per il marketing, si veda http://www.marketingexperiments.com/ per l’economia, si veda l’intervista a Charles Plott e il sito del Laboratory for Experimental Economics and Political Science del California Institute of Technology)

Negli esperimenti possiamo tenere sotto controllo diretto almeno una variabile. Una tecnica classica utilizzate per l’analisi dei dati sperimentali.

DATI OSSERVAZIONALI

In questo caso i dati sono a disposizione a seguito della raccolta attraverso un determinato disegno, che però non implica la possibilità di “tenere sotto controllo” alcuna variabile. Per questo motivo (fondamentale), con i dati di tipo osservazionale il problema è di tenere sotto controllo i fattori “terzi” che influenzano il risultato dell’analisi, in aggiunta ai fattori che ci interessano più direttamente.

Salvo poche eccezioni, tutti i dati che si reperiranno sono esito di un disegno osservazionale. Distinguiamo ulteriormente i dati osservazionali.

DATI OSSERVAZIONALI MICRO

Questi dati si riferiscono ad un campione (o eventualmente ad un universo) di “individui” o unità assimilabili a individui in quanto a capacità di prendere decisioni (es. coppie, famiglie, aziende). Il campione è solitamente selezionato con criteri probabilistici. Solo in casi particolari abbiamo a disposizione l’universo in dati micro (registri di popolazione, di imprese, di studenti).

I dati micro sono solitamente raccolti attraverso registri ufficiali oppure attraverso questionari. I questionari sono somministrati con tecniche diverse: ad esempio:

Esiste una specifica regolazione delle attività di somministrazione questionario. In Italia ad esempio i sondaggi sono regolamentati dall’Autorità per le garanzie nelle comunicazioni. Si veda il sito http://www.agcom.it/sondaggi/sondaggi.htm.

DATI OSSERVAZIONALI MACRO

Questi dati hanno a che fare con unità cui non si riconoscono (almeno non solitamente) capacità decisionali. Tipicamente: paesi, regioni ecc.

Il problema classico dell’analisi su dati macro è la “fallacia ecologica”; che consiste nell’inferire da una relazione osservata su dati macro un’analoga relazione sulle unità micro.

DATI TRASVERSALI E LONGITUDINALI, SERIE TEMPORALI

Secondo un’altra linea di classificazione, i dati possono essere trasversali (cross-section), ovvero relativi allo stesso punto del tempo e a più unità statistiche. Nel caso dei dati macro per paese, l’analisi su dati cross-section si definisce di solito analisi cross-country.

I dati possono essere longitudinali o panel. In questo caso per ogni osservazione (macro o micro), si hanno a disposizione più punti nel tempo.

Solitamente si parla di serie storiche, o serie temporali, quando le osservazioni riguardano la stessa unità in più punti nel tempo.

Dove trovare i dati?

La domanda principale che solitamente si pone chi desidera effettuare delle analisi statistiche è dove trovare i dati? Possiamo in generale affermare che si troveranno più facilmente dati di tipo macro che non dati di tipo micro, dati trasversali o relativi a serie temporali piuttosto che dati longitudinali.

Una prima possibilità è prendere in considerazione quanto offre la Biblioteca dell’Università Bocconi. Di particolare interesse per il reperimento dei dati è la parte relativa alle “Risorse Elettroniche”.

Vediamo cosa si può trovare su web (a volte con accesso riservato partendo dai computer dell’Università Bocconi). Il web è certamente la modalità attuale, più promettente e più democratica per la diffusione di dati

DATI MACRO

Altri progetti spesso indipendenti raccolgono dati su temi specifici. Ad es. la PENN WORLD TABLE fornisce indicatori su prezzi, redditi ecc. per 168 paesi nel periodo 1950-2000: http://pwt.econ.upenn.edu/

DATI MICRO

Solitamente è più complesso avere accesso a dati micro, per problemi pratici di distribuzione di tali dati (i dataset micro sono solitamente molto più grandi e pesanti rispetto a quelli macro), per questioni relative alla proprietà dei dati, per questioni relative alla privacy.

Vi sono differenze a livello internazionale. Ad esempio spesso nei paesi anglosassoni è richiesto mettere a disposizione per la ricerca i dati raccolti attraverso finanziamenti pubblici; in alcuni casi chi raccoglie i dati fornisce anche interfacce web per l’analisi. In Italia spesso si invoca la privacy, o si chiede un pagamento per ottenere i dati.

Esistono poi archivi di micro dati e indagini sui temi più vari che per gli iscritti forniscono i dati. Ad es.