层级群集
层级群集根据项目之间的距离或相似度在采用树形结构的层级中排列项目。生成的层级的图形表示为树状结构图表(称为树形图)。在 Spotfire 中,层级群集和树形图与热图图表紧密连接。您可以在热图中对行和列进行群集分析。行树形图显示了行之间的距离或相似度以及进行群集分析所得的各行所属的节点。列树形图显示了变量(所选单元格值列)之间的距离或相似度。
注: 必须在已安装的客户端中创建层级群集。
以下示例显示了带有行树形图的热图:

可以通过以下两种方式执行层级群集分析:使用层级群集工具,或者在现有热图图表上执行层级群集。如果使用层级群集工具,将创建具有树形图的热图。要了解有关热图和树形图的更多信息,请参见热图和树形图和群集。

可以通过以下两种方式执行层级群集分析:使用层级群集工具,或者在现有热图图表上执行层级群集。如果使用层级群集工具,将创建具有树形图的热图。要了解有关热图和树形图的更多信息,请参见热图和树形图和群集。
算法
在 Spotfire 中用于层级群集的算法是层级凝聚算法。对于行群集,群集分析从在单个群集中放置的每个行开始。然后,使用选定的距离度量计算两个行所有可能组合之间的距离。之后,两个最类似的群集将分组在一起并构成新群集。在后续步骤中,将使用选定的群集方法重新计算新群集与所有剩余群集之间的距离。因而,在每个迭代步骤中,群集的数量将减少一个。最后,所有行都分组至一个大群集。树形图中行的顺序由选定的排序权重定义。群集分析与列群集的工作原理一样。
注: 进行群集时,只包括数字列。
- 使用层级群集工具执行群集分析
层级群集工具在数据表中将行和/或列进行分组,然后根据行和/或列之间的距离或相似度,采用树形图在热图图表中对其进行排列。使用层级群集工具时,输入为数据表,结果为带有树形图的热图。 - 距离度量
可以使用许多不同的度量来计算行或列之间的距离或相似度。 - 聚类分析法
层级群集分析通过使用选定的距离度量来计算两个行或列的所有可能组合之间的距离开始。然后,这些计算得出的距离用于衍生在群集期间从行或列构成的所有群集之间的距离。 - 排序权重
排序权重用于控制行在行树形图中显示的垂直顺序。对于列树形图,排序权重可控制列的水平顺序。群集中的两个子群集(总是正好有两个子群集)进行加权,具有较低权重的群集放置在另一个群集的左上方。 - 层级群集参考
Spotfire 客户端中的层级群集工具是使用以下参考构建的。
- 使用层级群集工具执行群集分析
层级群集工具在数据表中将行和/或列进行分组,然后根据行和/或列之间的距离或相似度,采用树形图在热图图表中对其进行排列。使用层级群集工具时,输入为数据表,结果为带有树形图的热图。 - 距离度量
可以使用许多不同的度量来计算行或列之间的距离或相似度。 - 聚类分析法
层级群集分析通过使用选定的距离度量来计算两个行或列的所有可能组合之间的距离开始。然后,这些计算得出的距离用于衍生在群集期间从行或列构成的所有群集之间的距离。 - 排序权重
排序权重用于控制行在行树形图中显示的垂直顺序。对于列树形图,排序权重可控制列的水平顺序。群集中的两个子群集(总是正好有两个子群集)进行加权,具有较低权重的群集放置在另一个群集的左上方。 - 层级群集参考
Spotfire 客户端中的层级群集工具是使用以下参考构建的。
父主题: 统计工具