K 均值群集

K 均值聚类是将数据表划分为子集（群集）的算法，通过这种方式，每个群集中的成员颇为相似。

Spotfire 中的 K 均值聚类基于已配置的可视化折线图，从而每条线都与数据表根视图中的某一行相对应，如果折线图已聚合，线与根视图中的行存在一对多映射。可将基于数据重心的搜索、单位重量和相关性或欧氏距离作为距离度量来初始化聚类分析。聚类分析始终在已筛选的行中执行。如果您希望聚类分析中包含所有行，则必须在进行聚类分析之前重置所有筛选器。在作为起点的折线图中指定聚类分析操作应基于的列。

如果折线图属性中“外观”下的空值处理设置为继续线条，则空值将被替换为行（线）插值（与图表中显示的内容类似）。如果图表设置为在空值时中断线条，则包含空值的任何行（线）都将从聚类分析操作中排除。

注：如果输入折线图已格栅化，则用作格栅化依据的列或表达式将在 K 均值聚类运行时移动到“线依据”设置。这样做是为了在格栅面板中显示 K 均值结果后保留折线图中的原始线。

参考：

Mirkin, B.(1996) Mathematical Classification and Clustering, Nonconvex Optimization and Its Applications Volume 11, Pardalos, P. and Horst, R., editors, Kluwer Academic Publishers, The Netherlands.

MacQueen, J.(1967).Some methods for classification and analysis of multivariate observations.In Le Cam, L. M. and Neyman, J., editors, Proceedings of the Fifth Berkeley Symposium on Mathematical Statistics and Probability.Volume I:Statistics, pages 281-297.University of California Press, Berkeley and Los Angeles, CA.

Hair, J.F.Jr., Anderson, R.E., Tatham, R.L., Black, W.C.(1995) Multivariate Data Analysis, Fourth Edition, Prentice Hall, Englewood Cliffs, New Jersey.