ØValore caratteristico di dispersione
L’indice
di squilibrio tra tutte le frequenze
di tutte le categorie può essere basato sulla probabilità che, data una certa
distribuzione di frequenza, gli stati di due casi diversi siano stati
assegnati alla stessa modalità. Tale probabilità, naturalmente, è più alta
quanto più è basso il numero delle categorie
e quanto più sono squilibrate le frequenze a favore di una categoria
(se quasi tutti i dati sono stati assegnati alla categoria A, è molto
probabile che due dati presi a caso siano stati entrambi assegnati ad essa).
Le lettere che stanno sopra e sotto il
simbolo k si leggono “con j che va da 1 a k” e indicano che si devono sommare
tutte le probabilità () relative ad una qualsiasi categoria, dalla prima
all’ultima (k è il simbolo abitualmente usato per indicare il numero delle
categorie).
Nel caso di due
categorie tale minimo vale 1/k = ½ = 0.5 (vedi figura).
Il minimo si ha quando
tutte le categorie hanno pari frequenze e vale 1/k.