Analisi discriminante

Esercizio 1

Il dataset World.sav contiene dati relativi a variabili economiche e socio-demografiche per 109 paesi del mondo.

Quesito

I paesi possono essere divisi in due gruppi a seconda che appartengano o meno all’OCSE. Scopo dell’analisi è tracciare il profilo dei paesi appartenenti ai due gruppi con riferimento a variabili di tipo economico e demografico, ricorrendo ad una Analisi Discriminante implementata con SPSS.

Prendiamo  in considerazione le seguenti  variabili:

L’analisi discriminante è qui impiegata con uno scopo descrittivo: intendiamo stabilire se e in quale misura i due gruppi di paese differiscano rispetto alle variabili considerate.

Dal menu Analyse, selezioniamo Classify e quindi Discriminant:

Selezioniamo come Grouping variable OCSE, che assume valore 1 se il paese appartiene all’OCSE e 0 altrimenti. Indichiamo quindi 0 e 1 rispettivamente come minimo e massimo all’interno del menu Define Range.

Selezioniamo come Independents le variabili: gdp_cap, urban, lifeexpf, literacy, babymort.

Dal menu Statistics selezioniamo le statistiche descrittive, Descriptives e i coefficienti della funzione discriminante, Fisher’s Coefficients.

Dal menu Classify, selezioniamo Summary Table.

Analisi dell’output

L’output che si ottiene si apre con le statistiche descrittive (medie e scarti quadratici) delle variabili selezionate.

In media, la percentuale di residenti nelle città e la percentuale di persone in grado di leggere sono maggiori nei paesi dell’OCSE così come il prodotto interno lordo per abitante , mentre i tassi di mortalità infantile sono maggiori nei paesi non OCSE. La significatività di tali differenze tra le due popolazione viene sottoposta a verifica con un ANOVA sulle singole variabili di cui si riportano i risultati nella tabella seguente:

Per le quattro variabili in considerazione l’ipotesi di uguaglianza dei valori attesi nei due gruppi di paesi viene rifiutata.

Utilizziamo allora le quattro variabili selezionate per la costruzione della funzione discriminante di Fisher.

Nella tabella di seguito, si riportano i valori dei coefficienti della funzione discriminante di Fisher, standardizzati. Il prodotto interno lordo fornisce il contributo maggiore nella separazione delle due popolazioni seguito dalla percentuale di residenti nelle città.

A partire dalla funzione discriminante, calcoliamo gli score per ciascun paese. I box plot di seguito riportati forniscono una descrizione della distribuzione degli score nelle due popolazioni.

I due gruppi appaiono ben distinti dalle variabili in considerazione: più del 75% degli score dei paesi non OCSE sono negativi mentre tutti gli score per i paesi OCSE sono positivi.

Nella tabella di seguito si riportano i risultati della classificazione mediante la funzione discriminante stimata.

6 paesi su 107 non sono classificati correttamente. Dall’output ricaviamo che la Grecia è il paese OCSE classificato come non OCSE, mentre i paesi non OCSE che sono classificati come OCSE sono Hong Kong, Israele, Giappone, Singapore, Emirati Arabi.

Ciò sembra indicare che la funzione discriminante separa i paesi “più ricchi” dai paesi “più poveri”. I paesi non OCSE classificati erroneamente sono infatti a elevato benessere, mentre la Grecia è, nel database World, il più povero tra i paesi OSCE.