Guida dell'utente di Spotfire®

Clustering gerarchico

Il clustering gerarchico dispone gli elementi in una gerarchia con una struttura simile alla struttura ad albero basata sulla distanza o sulla similarità tra gli oggetti. La rappresentazione grafica della gerarchia risultante è un grafico ad albero denominato dendrogramma. In Spotfire, il clustering gerarchico e i dendrogrammi sono strettamente collegati alle visualizzazioni di mappe termiche. Nella mappa termica è possibile raggruppare sia le righe che le colonne. I dendrogrammi riga mostrano la distanza o la similarità tra le righe e a quali nodi appartiene ciascuna riga come risultato del clustering. I dendrogrammi colonna mostrano la distanza o la similarità tra le variabili (colonne valori con cella selezionata).

Nota: Il clustering gerarchico deve essere creato nel client installato.
L'esempio che segue mostra una mappa termica con un dendrogramma riga:

Il clustering gerarchico può essere eseguito in due diversi modi: utilizzando lo strumento di clustering gerarchico oppure eseguendo il clustering gerarchico su una visualizzazione di mappa termica esistente. Se si utilizza lo strumento di clustering gerarchico, viene creata una mappa termica con un dendrogramma. Per saperne di più su mappe termiche e dendrogrammi, vedere Mappa termica e Dendrogrammi e clustering.

Algoritmo

L'algoritmo utilizzato per il clustering gerarchico in Spotfire è un metodo agglomerativo gerarchico. Per il clustering delle righe, l'analisi cluster inizia con il posizionamento di ciascuna riga in un cluster separato, quindi viene calcolata la distanza tra tutte le possibili combinazioni di due righe utilizzando una misura della distanza selezionata. I due cluster più simili vengono raggruppati per formare un nuovo cluster. Nelle fasi successive, la distanza tra il nuovo cluster e tutti i cluster rimanenti viene ricalcolata utilizzando un metodo di clustering selezionato. Il numero di cluster viene così ridotto di uno in ogni fase di iterazione. Infine, tutte le righe vengono raggruppate in un grande cluster. L'ordine delle righe in un dendrogramma è definito in base al peso ordinamento selezionato. L'analisi cluster funziona nello stesso modo per il clustering delle colonne.

Nota: durante il clustering vengono incluse solo le colonne numeriche.