Guia do Usuário do Spotfire®

Formato da tabela de dados do dendrograma

Um dendrograma pode ser importado e usado em um mapa de calor por meio de uma tabela de dados, desde que siga o formato especificado neste tópico.

Os cabeçalhos de coluna na tabela de dados devem ser nomeados exatamente como visto abaixo e ter o tipo apropriado:

  • NodeID (integer)
  • ParentID (integer)
  • PruningLevel (integer)
  • Height (numeric)
  • LeafOrder (integer)
  • + um ou mais Colunas de Identificadores de Folha


Nessa tabela, cada linha corresponde a um nó no dendrograma e seus atributos associados. No dendrograma abaixo, o NodeID de cada nó foi indicado por um número.



NodeID

O NodeID fornece um número único para cada nó no dendrograma.

ParentID

Combinado com o NodeID, o ParentID determina a hierarquia do dendrograma. Para cada NodeID, o ParentID correspondente declara que o nó é sua origem. Por exemplo, o nó 2 tem o pai 6, que, por sua vez, tem o pai 7, que, por sua vez, tem o pai 10, que, por sua vez, tem o pai -1. Como -1 não está presente na coluna NodeID, isso significa que -1 é um nó raiz. Observe que pode haver vários nós de raiz. Cada ParentID único que não corresponde a um NodeID será interpretado como um nó raiz.

PruningLevel

O PruningLevel é uma informação adicional, necessária para interpretar cortes como colunas de grupo. A partir de um PruningLevel, o sistema encontra os nós associados mais próximos em um perspectivo corte como segue: Pense em todas as linhas como ramos. Corte todos os ramos < PruningLevel. Então você terá um conjunto de nós restantes. Então remova todos nós cujas origens é a quantidade de nós restantes.

No exemplo acima, isto significa:

  • Cortar no nível 0 -> um nó (10) será encontrado.
  • Cortar no nível 1 -> dois nós (7, 9) serão encontrados.
  • Cortar no nível 2-> quatro nós (0, 5, 6, 8) serão encontrados.
  • Cortar no nível 3 -> seis nós (0, 1, 2, 3, 4, 5) serão encontrados, todas as folhas.

Height

A Altura determina a posição do nó. Para um dendrograma de linha como no exemplo acima, isto significa a posição horizontal relativa a borda do Mapa de calor. No exemplo, todas as folhas tem altura 0, assim, eles começam pela mais próxima do Mapa de calor. Cada origem deve ter um valor crescente, à medida que se aproximam da raiz do dendrograma.

À primeira vista, a altura de cada nó não pode significar muito. Mas há formas de fazer este atributo assumir mais significado. Por exemplo, usando funções de dados para calcular um dendograma, você pode atribuir valores à altura de cada nó, o que indica quão bem cada nó se correlaciona com seu cluster. Por exemplo, uma altura baixa poderia indicar que o nó se correlaciona bem, enquanto que uma altura maior poderia indicar que o nó é uma exceção.

LeafOrder

Cada linha que é uma folha, deve ter um número LeafOrder. Estes números indicam o fim das folhas. Os nós que não são folhas tem um valor vazio.

Colunas adicionais identificadoras de folha

Colunas adicionais na tabela de dados do dendrograma são colunas identificadoras de folha. No exemplo acima, há apenas uma coluna identificadora, mas é bem possível ter várias. As colunas identificadoras de folha são usadas para combinar e classificar o mapa de calor.