余弦相关性
余弦相关性是进行层级群集时常用的相似性度量。
a 和 b 两个点(具有 k 维度)之间的余弦相关性计算方法为:
其中


余弦相关性范围从 +1 到 -1,其中 +1 是最高相关系数。完全相反的点具有相关系数 -1。
余弦相关性与相关性之间的比较
余弦相关性与相关性之间的不同之处在于在相关性中减去平均值。在下面的示例中,在点 a、b 和 c 的任意组合之间,余弦相关性为 +1,但是在点 d和任何其他点之间,余弦相关性较小,为 +0.974。但是,在任意点之间(包括点 d),一般相关性为 +1。


父主题: 距离度量