K 均值群集
K 均值聚类是将数据表划分为子集(群集)的算法,通过这种方式,每个群集中的成员颇为相似。
Spotfire 中的 K 均值聚类基于已配置的可视化折线图,从而每条线都与数据表根视图中的某一行相对应,如果折线图已聚合,线与根视图中的行存在一对多映射。可将基于数据重心的搜索、单位重量和相关性或欧氏距离作为距离度量来初始化聚类分析。聚类分析始终在已筛选的行中执行。如果您希望聚类分析中包含所有行,则必须在进行聚类分析之前重置所有筛选器。在作为起点的折线图中指定聚类分析操作应基于的列。
参考:
Mirkin, B.(1996) Mathematical Classification and Clustering, Nonconvex Optimization and Its Applications Volume 11, Pardalos, P. and Horst, R., editors, Kluwer Academic Publishers, The Netherlands.
MacQueen, J.(1967).Some methods for classification and analysis of multivariate observations.In Le Cam, L. M. and Neyman, J., editors, Proceedings of the Fifth Berkeley Symposium on Mathematical Statistics and Probability.Volume I:Statistics, pages 281-297.University of California Press, Berkeley and Los Angeles, CA.
Hair, J.F.Jr., Anderson, R.E., Tatham, R.L., Black, W.C.(1995) Multivariate Data Analysis, Fourth Edition, Prentice Hall, Englewood Cliffs, New Jersey.
- 执行 K 均值聚类
K 均值聚类工具用于将折线图中的线条分为相似线条的不同组(群集)。
- 执行 K 均值聚类
K 均值聚类工具用于将折线图中的线条分为相似线条的不同组(群集)。