距离度量
可以使用许多不同的度量来计算行或列之间的距离或相似度。
层级群集工具可以使用以下度量:
术语“维度”在所有距离度量中都使用。如果我们在三维空间中描述点的物理位置(X Y 和 Z 轴上的位置指代点的不同维度),维度概念其实很容易理解。但是,维度中的数据可以为任何类型。例如,如果按身高、年龄和国籍来描述一组人,这也是一个三维系统。对于行(或列),维度的数量等于行(或列)中变量的数量。
注: 群集计算的结果将显示或群集的行或列之间的相似度或距离。欧氏距离、城市街区距离、平方欧氏距离和半平方欧氏距离将表示行或列之间的距离。另一方面,相关性、余弦相关性和 Tanimoto 系数表示行或列之间的相似度。
注: 在群集中使用时,相似度量相关性、余弦相关性和 Tanimoto 系数可能被转换,以使其始终大于或等于零(使用 1 – 相似度值)。
- 相关性
相关性是进行层级群集时常用的相似性度量。 - 余弦相关性
余弦相关性是进行层级群集时常用的相似性度量。 - Tanimoto 系数
Tanimoto 系数是进行层级群集时常用的相似性度量。 - 欧氏距离
欧氏距离是进行层级群集时常用的距离度量。 - 城市街区距离
城市街区距离是进行层级群集时常用的距离度量。 - 平方欧氏距离和半平方欧氏距离
平方欧氏距离和半平方欧氏距离是在进行层级群集时,用于计算相似性的两种常用的距离度量。
父主题: 层级群集