K平均法クラスタリング

各クラスタのメンバーが比較的同様になるように、K平均法クラスタリングは、データテーブルをサブセット (クラスタ) にパーティション化するアルゴリズムです。

Spotfire の K平均法クラスタリングは、ラインチャートのビジュアライゼーションに基づいています。データテーブルのルートビューで各折れ線が 1 つのローと対応するように設定されているか、ラインチャートが集計される場合は、ルートビューの折れ線とローの間で一対多数のマッピングがあるように構成されています。クラスタリングは、データの重心をベースに検索を行うことで初期化され、ユニットの重みと、コリレーションまたはユークリッド距離を距離の計測に使用します。クラスタリングは、必ずフィルターローで実行されます。すべてのローをクラスタリングの対象にする場合は、すべてのフィルターをリセットしてからクラスタリングする必要があります。クラスタリング操作が基づくカラムは、開始ポイントとして使用されるラインチャートで指定されます。

ラインチャートのプロパティの [外観] で空の値の処理が線を継続するように設定されている場合、ビジュアライゼーションで示されているものと同様に、ロー (線) 補間を使用して空の値が置き換えられます。ビジュアライゼーションが空の値で改行するように設定されている場合、空の値を含むロー (線) は、クラスタリング操作から除外されます。

注: 入力ラインチャートがトレリス化されている場合、トレリス化に使用されるカラムまたは式は、K平均法クラスタリングの実行時に [線の基準] の設定に移動します。これは、トレリスパネルに K平均法の結果を表示した後にラインチャートの元のローを維持するために行われます。

リファレンス:

Mirkin, B.(1996) Mathematical Classification and Clustering, Nonconvex Optimization and Its Applications Volume 11, Pardalos, P. and Horst, R., editors, Kluwer Academic Publishers, The Netherlands.

MacQueen, J.(1967).Some methods for classification and analysis of multivariate observations.In Le Cam, L. M. and Neyman, J., editors, Proceedings of the Fifth Berkeley Symposium on Mathematical Statistics and Probability.Volume I:Statistics, pages 281-297.University of California Press, Berkeley and Los Angeles, CA.

Hair, J.F.Jr., Anderson, R.E., Tatham, R.L., Black, W.C.(1995) Multivariate Data Analysis, Fourth Edition, Prentice Hall, Englewood Cliffs, New Jersey.