6 - Gli indici di variabilità o di dispersione.
 
Il campo di variazione già visto in precedenza è già di per sé un indice di variabilità. Valori estremi vicini alla media sono indice di omogeneità, mentre valori estremi molto lontani dalla media ci dicono che la nostra popolazione presenta un certo grado di disomogeneità. Il campo di variazione è quindi un indicatore, anche se non una misura della variabilità di un dato all'interno di una certa popolazione.
Analogo, rispetto al campo di variazione, quale indice della variabilità della popolazione, è la cosiddetta differenza interquartile. Definiamo quartile ciascuno dei tre termini che dividono una popolazione (i cui elementi siano disposti in ordine progressivo), in quattro parti, ciascuna delle quali è formata da un quarto degli elementi dell'intera popolazione.
Nel nostro caso la popolazione è costituita da 426 termini e ogni quartile deve suddividere la popolazione in gruppi di 106,5 individui. Non potendo dividere a metà i nostri elementi, per il primo quartile consideriamo la media tra il 106 e il 107 elemento che hanno rispettivamente valore 49 e 50. La loro media 49,5 rappresenterà il primo quartile. Il secondo quartile è rappresentato dalla 213a foglia (che abbiamo già incontrato chiamandola mediana), il cui valore, come sappiamo è 54. Come per il primo, anche per il terzo quartile avremmo dovuto calcolare la media tra la 319a e la 320a foglia, ma ciò non è necessario, poiché hanno entrambe valore 60. Riassumendo si ha:
primo quartile: 49,5
secondo quartile: 54
terzo quartile: 60
Un quarto delle foglie raccolte ha lunghezza inferiore a 49,5, un quarto ha lunghezza compresa tra 40,5 e 54, un quarto tra 54 e 60 e un quarto superiore a 60. La differenza interquartile è data dalla differenza tra i valori dei terzo e del primo quartile. Essa è dunque 60-49,5 = 10,5
Come per il campo di variazione, anche la differenza interquartile è un indicatore, più che una misura della dispersione, ma rispetto al primo, presenta un maggior grado di raffinatezza, poiché tende ad escludere i valori estremi, più lontani dalla media, ma anche meno frequenti e, come tali, affetti da un certo grado di anomalia. Potremmo indicarla come il grado di variabilità riferito al solo "ceto medio", escludendo disoccupati, sottoccupati, extracomunitari e finanzieri, calciatori di Serie A, dirigenti di aziende e grandi evasori fiscali.
Una prima misura della variabilità si può avere calcolando lo scarto medio assoluto. Per scarto s'intende la differenza tra il valore di ogni termine e la media. Lo scarto medio assoluto è dato dalla media dei valori assoluti degli scarti.
Ormai siamo così abituati alla comodità del computer, che non ci verrebbe mai in mente di fare a mano tutti i calcoli necessari. Per calcolare la media, basta posizionarsi in fondo alla colonna dei dati, in corrispondenza della cella A427 ed usare la funzione apposita, che per il più diffuso dei fogli elettronici, è data dalla formula =MEDIA(A1:A426). Poi, nella cella B1, a fianco del primo dato, si scrive la formula =ASS(A1-$A$427), che fornisce il valore assoluto della differenza tra il primo termine (A1) e la media (A427). I simboli del $ posti davanti ai riferimenti della cella A427 servono a mantenere fisso il riferimento a tale cella, mentre si copia in basso la formula fino alla cella B426 e si ottengono via via tutti gli altri scarti, poiché l'indice A1 della formula scorrerà progressivamente nella formula fino al valore A426. Ora, nella cella B427, usiamo di nuovo la formula per il calcolo della media: =MEDIA(B1:B426). Ecco il nostro scarto medio assoluto: 6,168.... Esso sta a significare che in media, la lunghezza delle singole foglie differisce (in più o in meno) di circa 6 mm rispetto al valore medio.
Nelle ricerche statistiche i due indici di dispersione più significativi sono la varianza e lo scarto quadratico medio. La prima è definita come la media dei quadrati degli scarti. Il secondo, indicato con la lettera greca s, è anche chiamato deviazione standard ed è dato dalla radice quadrata della varianza.
Per calcolare la varianza useremo il foglio elettronico, in cui usiamo la colonna C per elevare al quadrato i termini della colonna B (gli scarti) mediante la formula =B1^2 da scrivere nella cella C1, per poi copiarla in basso fino alla cella C426.
Nella cella C427 si potrà inserire la formula della media =MEDIA(C1:C426) ed avere la varianza 59,658...
Lo scarto quadratico medio, a questo punto, è facile da trovare: basterà inserire nella cella C428 la formula =RADQ(C427) e veder apparire il valore 7,723...
I fogli elettronici dispongono anche delle suddette due funzioni, alle quali corrispondono rispettivamente le formule =VAR(A1:A426) e =DEV.ST(A1:A426). Una volta che si è capito come vanno calcolate varianza e deviazione standard, si può risparmiare tempo e lavoro, usando semplicemente le due formule.
Varianza e scarto quadratico medio hanno importanti applicazioni nelle rilevazioni statistiche, ma è bene per ora limitarci a darne semplicemente la definizione.