Spotfire® 用户指南

树形图和群集

树形图是热图中使用的树状结构图,用来使层级群集计算的结果可视化。根据选定距离度量,群集的结果显示为群集行或列之间的距离或相似度。

注: 必须在已安装的客户端中创建树形图。
请参见距离度量和对每个度量的详细描述,以获得关于可用距离度量的更多信息。在已安装的客户端中,可以通过打开“图表属性”对话框的“树形图”部分对现有热图执行层级群集。您还可以使用层级群集工具与数据表进行群集作为输入。要了解有关层级群集和热图的更多信息,请分别参见层级群集热图。请注意,群集时仅包括数值列。
提示: 可以从“图表属性”对话框的“树形图”页面中导出或导入树形图。
注: 要首次使树形图可见或在更改任何群集设置后使其可见,必须对其进行更新。在图表属性中,单击“更新”按钮或选择自动更新。

行树形图

行树形图显示了行之间的距离或相似度以及作为群集计算结果的各行所属的节点。行树形图的示例如下所示。

在行树形图中,群集数据中的各行由最右侧的节点、叶节点表示。树形图中的每个节点表示树形图中位于其右侧的所有行的群集。因此,树形图中最左侧的节点是包含所有行的群集。垂直虚线是修剪线,可在树形图中将其向一侧拖动。修剪线旁边的值表示从该线的当前位置开始的群集数,以及在该位置处计算得出的距离和相似度。在上例中,计算得出的距离是 1.59,有三个群集从该修剪线位置处开始。上面两个用粉红色圆圈表示的群集包含两行或更多行,而下面的群集仅包含单独一行。

列树形图

列树形图的绘制方法与行树形图相同,但显示了变量(单元格值列)之间的距离或相似度。

在上例中修剪线位置处,有两个群集。最左侧的群集包含两列,而最右侧的群集仅包含单独一列。计算得出的距离是 6.08。

与树形图进行交互

使用树形图可以轻松地在热图中进行突出显示和标记。可将鼠标悬停在树形图上,以突出显示热图中的群集及其相应的单元格。您可以单击以标记群集。这样还可以标记热图中相应的单元格,如下例所示。工具提示显示了关于群集的信息。

群集

正如所述,树形图在执行群集时添加到热图中。还会向数据表添加一个新列,且可作为筛选器加以使用。群集列是动态的,修剪线的位置决定其内容。下例显示了以上行树形图的群集列和群集筛选器的外观。

群集列包含与修剪线位置对应的群集节点的唯一标识符。在上例中,已标识两个群集节点。测试 B、测试 C 和测试 F 属于标识符为 3 的群集节点,而测试 A 和测试 E 属于标识符为 5 的群集节点。第三个标识符 *6 是包含测试 D 的叶节点。通过群集列可一次筛选出全部群集。您还可以将其用于为其他图表着色或格栅化。
注: 如果将列树形图添加到配置了多个单元格值列的热图,那么群集列无法显示任何群集 ID。这意味着群集列无法用于筛选或对其他图表着色或格栅化的依据。此外,列树形图无法完全交互。例如,可能无法使用树形图在热图中亮显或标记。但是,您仍可以移动修剪线以查看计算得出的距离或相似度,以及群集数。

可以使用图表属性将树形图放置在图表的不同侧,以及对设置进行其他更新。“使用 Log 刻度”选项将刻度从线性刻度更改为以 10 为底的对数刻度 log10 (x)“显示修剪线”则指定是否在树形图中显示修剪线。还可以在属性中指定“修剪线颜色”“第一个可选群集颜色”“第二个可选群集颜色”

导入和导出树形图

Spotfire 中的所有树形图均可由数据表表示。这样即可使用除编辑群集设置对话框中包含的内容外的不同群集方法和统计计算。例如,可以使用数据函数来执行自定义 R 脚本,进而通过脚本使用所选的方法执行群集操作。更具体地说,您可以利用可按层级方式对叶排序的任何计算。此类过程的结果将是一个数据表,您可以向其添加分析,然后导入到热图并用于显示树形图。

您还可以从热图中导出树形图、查看生成的数据表、进行修改和将其导入回热图(以便修改树形图)。
提示: 要导出此数据表在 Spotfire 之外使用,请使用“文件” > “导出” > “将数据导出到文件”,并选择导出刚创建的数据表。

将树形图导出到数据表,然后将其再次导入的另一个原因是性能。如果您的数据集确实很大,对其执行群集方法时,计算可能需要一些时间。如果您已运行过一次树形图中使用的群集方法,则无需再次运行群集即可将其导出,稍后再导入。

Spotfire 中使用的树形图的数据表表示必须符合特定格式。此格式在树形图数据表格式中介绍。

关于 R

R 在遵守单独的开源软件许可条款的前提下提供,并不是 Spotfire 的一部分。因此,R 不在您的 Spotfire 的许可范围内。Cloud Software Group, Inc. 不以任何形式对 R 提供支持、维护或保证。对 R 的下载和使用由您全权决定,且需遵守适用于 R 的免费开源许可条款。