Dendrogramas y agrupación en clúster
Un dendrograma es un gráfico con estructura de árbol que se usa en los mapas de calor para visualizar el resultado del cálculo de la agrupación jerárquica en clúster. El resultado de la agrupación en clúster se presenta como la distancia o como la similitud entre las filas o columnas agrupadas, según la medida de distancia seleccionada.
Dendrograma de filas

Las filas individuales de los datos agrupados en clúster se representan mediante los nodos más a la derecha, los nodos de hoja, del dendrograma. Cada nodo del dendrograma representa un clúster de todas las filas situadas a su derecha en el dendrograma. El nodo más a la izquierda es, por lo tanto, un clúster que contiene todas las filas. La línea de puntos vertical es la línea de eliminación, que puede arrastrarse hacia los lados del dendrograma. Los valores situados cerca de la línea de eliminación indican el número de clústeres que empiezan en la posición actual de la línea, así como la distancia o la similitud calculada en esa posición. En el ejemplo anterior, la distancia calculada es de 1,59 y hay tres clústeres que empiezan en la posición de la línea de eliminación. Los dos superiores, indicados con los círculos rosa, contienen dos o más filas, mientras que el inferior solo contiene una fila individual.
Dendrograma de columnas

En la posición de la línea de eliminación del ejemplo de arriba hay dos clústeres. El clúster más a la izquierda contiene dos columnas, mientras que el situado más a la derecha solo contiene una columna individual. La distancia calculada es de 6,08.
Interacción con el dendrograma

Agrupación en clúster

Puede colocar el dendrograma en diferentes lados de la visualización mediante las propiedades de visualización, así como realizar otras actualizaciones en la configuración. La opción Usar escala logarítmica cambia la escala de una escala lineal a una escala logarítmica de base 10, log10 (x), y Mostrar línea de eliminación especifica si se muestra la línea de eliminación en el dendrograma. También puede especificar el Color de línea de eliminación, el Primer color alterno de clúster y el Segundo color alterno de clúster en las propiedades.
Importación y exportación de dendrogramas
En Spotfire, todos los dendrogramas se pueden representar mediante una tabla de datos. Esto hace posible el uso de varios métodos de agrupación en clúster y de cálculos estadísticos, aparte de los incluidos en el cuadro de diálogo Editar configuración de agrupación en clúster. Por ejemplo, puede utilizar funciones de datos para ejecutar un script de R personalizado, que realiza una agrupación en clústeres con un método de su elección. En concreto, puede usar cualquier cálculo que pueda ordenar hojas de forma jerárquica. El resultado de estos procedimientos será una tabla de datos, que puede agregar al análisis e importar al mapa de calor para usarla a fin de mostrar un dendrograma.
Otra razón para exportar un dendrograma a una tabla de datos y, posteriormente, volver a importarlo es el rendimiento. Si tiene un conjunto de datos muy grande y le aplica un método de agrupación en clúster, los cálculos podrían tardar mucho. Si ha ejecutado alguna vez un método de agrupación en clúster que se use en un dendrograma, puede exportarlo e importarlo más tarde sin tener que volver a realizar la agrupación en clúster de nuevo.
La representación de tabla de datos de un dendrograma usada en Spotfire debe tener un formato concreto. Este formato se describe en Formato de la tabla de datos del dendrograma.
Acerca de R
R está disponible bajo los términos de una licencia de software de código abierto y no forma parte de Spotfire. Por lo tanto, R no queda cubierto por la licencia de Spotfire. Cloud Software Group, Inc. no ofrece asistencia técnica, mantenimiento ni garantías de ningún tipo relacionados con R. La descarga y el uso de R son de su responsabilidad exclusiva y se rigen por los términos de la licencia de código abierto aplicables a R.
- Formato de la tabla de datos del dendrograma
Un dendrograma se puede importar y utilizar en un mapa de calor a través de una tabla de datos, siempre que siga el formato especificado en este tema.