Guida dell'utente di Spotfire®

Esecuzione di un clustering con lo strumento di clustering gerarchico

Lo strumento di clustering gerarchico raggruppa righe e/o colonne in una tabella dati e le dispone in una visualizzazione di mappa termica con un dendrogramma (un grafico ad albero) in base alla distanza o alla similarità tra di loro. Quando si utilizza lo strumento di clustering gerarchico, l'input è una tabella dati mentre il risultato è una mappa termica con dendrogrammi.

Informazioni su questa attività

Vedere anche Clustering gerarchico.

È anche possibile avviare il clustering gerarchico su una mappa termica esistente dalla sezione Dendrogrammi delle proprietà di visualizzazione della mappa termica. Per ulteriori informazioni, vedere Mappa termica.

Prima di iniziare

Il clustering gerarchico deve essere creato nel client installato.

Procedura

  1. Nella barra dei menu, selezionare Strumenti > Clustering gerarchico.
  2. Se nell'analisi sono presenti più tabelle dati, selezionare una tabella dati su cui eseguire il calcolo del clustering.
  3. Fare clic su Seleziona colonne.
  4. Nella finestra di dialogo Seleziona colonne aggiungere le colonne da includere nel clustering, quindi fare clic su OK per chiudere la finestra.
  5. Se si desidera creare un dendrogramma riga, selezionare la casella di controllo Righe cluster.
  6. Fare clic sul pulsante Impostazioni per modificare le impostazioni di clustering.
  7. Nella finestra di dialogo Modifica impostazioni cluster, selezionare un Metodo di clustering.
    Per ulteriori informazioni sui metodi di clustering, vedereMetodi di clustering.
    Nota: se si seleziona il metodo di Ward come il metodo di clustering, la misura della distanza sarà automaticamente impostata sulla distanza euclidea semi-quadratica. Con il metodo di Ward, non è possibile utilizzare alcuna altra misura della distanza.
  8. Selezionare una misura di distanza.
    Per ulteriori informazioni sulle misure di distanza, vedere Misure delle distanze. Non è possibile rappresentare distanze superiori a 3.40282e+038.
  9. Selezionare il Peso ordinamento da utilizzare nel calcolo del clustering.
    Per ulteriori informazioni, vedere Peso ordinamento.
  10. Selezionare un metodo Sostituzione valore vuoto dall'elenco a discesa.
    OpzioneDescrizione
    Valore costante Sostituisce il valore vuoto con un numero costante che è possibile specificare personalmente.
    Media colonnaRestituisce la media dei valori di colonna corrispondenti. Se la colonna contiene solo valori vuoti, questi verranno sostituiti da 0, dato che non è possibile calcolare una media.
    Media rigaSostituisce il valore con il valore medio dell'intera riga. Se la riga contiene solo valori vuoti, questi verranno sostituiti da 0, dato che non è possibile calcolare una media.
    Interpolazione di lineaImposta il valore mancante come valore interpolato tra i due valori confinanti nella riga.
  11. Selezionare un metodo di normalizzazione da utilizzare nel calcolo del clustering.
    Per ulteriori informazioni, vedere Normalizzazione delle colonne. Se si normalizza per percentile è necessario specificare anche una percentuale.
  12. Fare clic su OK per chiudere la finestra di dialogo Modifica impostazioni cluster.
  13. Se si desidera creare un dendrogramma colonna, selezionare la casella di controllo Colonne cluster.
  14. Eseguire i passaggi da 6 a 12 per definire le impostazioni per il dendrogramma colonna.
  15. Fare clic su OK.

Risultati

viene eseguito il calcolo del clustering gerarchico e viene creata una visualizzazione di mappa termica con i dendrogrammi specifici. Inoltre, una colonna cluster viene aggiunta alla tabella dati e resa disponibile nel pannello dei filtri. Vedere Dendrogrammi e clustering per saperne di più sui dendrogrammi e sulle colonne cluster.