Clustering gerarchico
Il clustering gerarchico dispone gli elementi in una gerarchia con una struttura simile alla struttura ad albero basata sulla distanza o sulla similarità tra gli oggetti. La rappresentazione grafica della gerarchia risultante è un grafico ad albero denominato dendrogramma. In Spotfire, il clustering gerarchico e i dendrogrammi sono strettamente collegati alle visualizzazioni di mappe termiche. Nella mappa termica è possibile raggruppare sia le righe che le colonne. I dendrogrammi riga mostrano la distanza o la similarità tra le righe e a quali nodi appartiene ciascuna riga come risultato del clustering. I dendrogrammi colonna mostrano la distanza o la similarità tra le variabili (colonne valori con cella selezionata).

Il clustering gerarchico può essere eseguito in due diversi modi: utilizzando lo strumento di clustering gerarchico oppure eseguendo il clustering gerarchico su una visualizzazione di mappa termica esistente. Se si utilizza lo strumento di clustering gerarchico, viene creata una mappa termica con un dendrogramma. Per saperne di più su mappe termiche e dendrogrammi, vedere Mappa termica e Dendrogrammi e clustering.
Algoritmo
L'algoritmo utilizzato per il clustering gerarchico in Spotfire è un metodo agglomerativo gerarchico. Per il clustering delle righe, l'analisi cluster inizia con il posizionamento di ciascuna riga in un cluster separato, quindi viene calcolata la distanza tra tutte le possibili combinazioni di due righe utilizzando una misura della distanza selezionata. I due cluster più simili vengono raggruppati per formare un nuovo cluster. Nelle fasi successive, la distanza tra il nuovo cluster e tutti i cluster rimanenti viene ricalcolata utilizzando un metodo di clustering selezionato. Il numero di cluster viene così ridotto di uno in ogni fase di iterazione. Infine, tutte le righe vengono raggruppate in un grande cluster. L'ordine delle righe in un dendrogramma è definito in base al peso ordinamento selezionato. L'analisi cluster funziona nello stesso modo per il clustering delle colonne.
- Esecuzione di un clustering con lo strumento di clustering gerarchico
Lo strumento di clustering gerarchico raggruppa righe e/o colonne in una tabella dati e le dispone in una visualizzazione di mappa termica con un dendrogramma (un grafico ad albero) in base alla distanza o alla similarità tra di loro. Quando si utilizza lo strumento di clustering gerarchico, l'input è una tabella dati mentre il risultato è una mappa termica con dendrogrammi. - Misure delle distanze
Per calcolare la distanza o la similarità tra righe o colonne, è possibile utilizzare diverse misure. - Metodi di clustering
Il clustering gerarchico inizia attraverso il calcolo della distanza tra tutte le possibili combinazioni di due righe o colonne utilizzando una misura della distanza selezionata. Queste distanze calcolate vengono quindi utilizzate per ricavare la distanza tra tutti i cluster formati dalle righe o dalle colonne durante il clustering. - Peso ordinamento
Il peso ordinamento controlla in quale ordine verticale vengono visualizzate le righe nel dendrogramma riga. Per i dendrogrammi colonna, controlla l'ordine orizzontale delle colonne. I due cluster secondari di un cluster (i cluster secondari sono sempre due) vengono pesati e il cluster con il peso inferiore viene posizionato sopra (a sinistra) rispetto all'altro cluster. - Riferimenti sul clustering gerarchico
Lo strumento di clustering gerarchico nel client Spotfire viene creato utilizzando i riferimenti indicati di seguito.
- Esecuzione di un clustering con lo strumento di clustering gerarchico
Lo strumento di clustering gerarchico raggruppa righe e/o colonne in una tabella dati e le dispone in una visualizzazione di mappa termica con un dendrogramma (un grafico ad albero) in base alla distanza o alla similarità tra di loro. Quando si utilizza lo strumento di clustering gerarchico, l'input è una tabella dati mentre il risultato è una mappa termica con dendrogrammi. - Misure delle distanze
Per calcolare la distanza o la similarità tra righe o colonne, è possibile utilizzare diverse misure. - Metodi di clustering
Il clustering gerarchico inizia attraverso il calcolo della distanza tra tutte le possibili combinazioni di due righe o colonne utilizzando una misura della distanza selezionata. Queste distanze calcolate vengono quindi utilizzate per ricavare la distanza tra tutti i cluster formati dalle righe o dalle colonne durante il clustering. - Peso ordinamento
Il peso ordinamento controlla in quale ordine verticale vengono visualizzate le righe nel dendrogramma riga. Per i dendrogrammi colonna, controlla l'ordine orizzontale delle colonne. I due cluster secondari di un cluster (i cluster secondari sono sempre due) vengono pesati e il cluster con il peso inferiore viene posizionato sopra (a sinistra) rispetto all'altro cluster. - Riferimenti sul clustering gerarchico
Lo strumento di clustering gerarchico nel client Spotfire viene creato utilizzando i riferimenti indicati di seguito.