距離の計測
さまざまな計測を使用して、ローまたはカラム間の距離または類似度を計算できます。
階層的クラスタリング ツールでは次の計測を利用できます。
次元という用語は、すべての距離の計測で使用されます。次元の概念は、x、y、および z の軸上の位置が 3 次元空間内のポイントの別々の次元を指すときに、そのポイントの物理的位置を表す場合には、単純なものです。ただし、次元のデータはどのようなタイプにもできます。たとえば、人のグループを身長、年齢、および国籍で表した場合、これも 3 次元システムになります。ロー (またはカラム) の場合、次元の数はロー (またはカラム) の変数の数と同じです。
注: クラスタ計算からの結果は、クラスタ ローまたはカラムの間の類似度、あるいはそれらの間の距離のいずれかとして提供されます。ユークリッド距離、市街地距離、平方ユークリッド距離、および半平方ユークリッド距離では、ローまたはカラムの間の距離を提供します。それに対して、コリレーション、コサインのコリレーション、および Tanimoto 係数からの結果は、ローまたはカラムの間の類似度として提供されます。
注: クラスタリングで使用するときには、類似度を計測するコリレーション、コサインのコリレーション、および Tanimoto 係数は常にゼロ以上になるように (1 – 類似度の値を使用して) 変換される場合があります。
- コリレーション
コリレーションは、階層的クラスタリングを行う場合の一般的な類似度の統計です。 - コサインのコリレーション
コサインのコリレーションは、階層的クラスタリングを行う場合の一般的な類似度の統計です。 - Tanimoto 係数
Tanimoto 係数は、階層的クラスタリングを行う場合の一般的な類似度の統計です。 - ユークリッド距離
ユークリッド距離は、階層的クラスタリングを行う場合の一般的な距離の計測です。 - 市街地距離
市街地距離は、階層的クラスタリングを行う場合の一般的な距離の計測です。 - 平方ユークリッド距離と半平方ユークリッド距離
階層的クラスタリングを行うときに類似度を計算する 2 つの一般的な距離の計測は、平方ユークリッド距離と半平方ユークリッド距離です。
親トピック: 階層的クラスタリング