树形图数据表格式
树形图可以通过数据表导入并在热图中使用,前提是它遵循本主题中指定的格式。
最重要的是,数据表中的列表头必须完全按照如下所示命名,并具有相应的类型:
- NodeID (integer)
- ParentID (integer)
- PruningLevel (integer)
- Height (numeric)
- LeafOrder (integer)
- + 一个或多个叶标识符列

在此表中,每行都对应树形图中的节点及其关联属性。在下面的树形图中,每个节点的节点 ID 已由数字表示。

节点 ID
节点 ID 为树形图中的每个节点提供了唯一的数字。
父 ID
父 ID 与节点 ID 结合,确定了树形图的层级。对于每个节点 ID,相应的父 ID 会表明哪个节点是其父节点。例如,节点 2 的父节点是 6,节点 6 的父节点是 7,节点 7 的父节点是 10,节点 10 的父节点是 -1。由于 -1 在节点 ID 列中不存在,这意味着 -1 是根节点。请注意,可以存在多个根节点。每个不匹配节点 ID 的唯一父 ID 都将被解析为根节点。
修剪级别
修剪级别是将修剪解析为群集列所需的额外信息。系统可从修剪级别找到如下从修剪角度来看关联的最近节点。将所有行看作分支。修剪所有分支 < 修剪级别。然后,您将获得一组剩余节点。然后删除其父节点位于剩余节点的所有节点。
在以上示例中,这意味着:
- 在级别 0 处修剪 -> 将找到一个节点 (10)。
- 在级别 1 处修剪 -> 将找到两个节点(7、9)。
- 在级别 2 处修剪 -> 将找到四个节点(0、5、6、8)。
- 在级别 3 处修剪 -> 将找到六个节点(0、1、2、3、4、5),即所有叶。
Height
高度将决定节点的位置。对于以上示例中的行树形图,这表示相对于热图边缘的水平位置。在示例中,所有叶的高度为 0,则它们始于最靠近热图的位置。随着每个父节点越来越靠近树形图的根,它们必须有增加值。
乍看之下,每个节点的高度可能没有太多含义。但有几种方式可以让此属性具有更多含义。例如,通过使用数据函数计算树形图,可以向每个节点的高度赋值,这表明了每个节点与其群集的相互关联程度。例如,距离短可以表明节点关联紧密,而较长的距离则可以表明节点是离群值。


叶序
作为叶的每行必须包含叶序编号。这些编号说明了叶的顺序。不是叶的节点包含空值。
其他叶标识符列
树形图数据表中的其他列是叶标识符列。在以上示例中,只有一个标识符列,但也可以有多个标识符列。叶标识符列可用于匹配和排序热图。
父主题: 树形图和群集