Métodos de agrupación en clúster
Para la agrupación jerárquica en clúster, se empieza por calcular la distancia entre todas las combinaciones posibles de dos filas o columnas mediante una medida de distancia seleccionada. Estas distancias calculadas se usan a continuación para determinar la distancia entre todos los clústeres formados a partir de las filas o columnas durante la agrupación en clúster.
Consulte también Mediciones de distancia.
Es posible seleccionar uno de los métodos de agrupación en clúster siguientes:
- UPGMA
UPGMA son las siglas en inglés de Método no ponderado de grupos de pares con media aritmética. - WPGMA
WPGMA son las siglas en inglés de Método ponderado de grupos de pares con media aritmética. - Vinculación sencilla
Este método se basa en la distancia mínima. Para calcular la distancia entre dos clústeres, se compara cada posible combinación de dos filas (o columnas) entre los dos clústeres. La distancia entre los clústeres es la misma que la distancia entre las dos filas (o columnas) de los clústeres menos distantes. - Vinculación completa
Este método se basa en la distancia máxima y se puede considerar como el contrario a la vinculación simple. Para calcular la distancia entre dos clústeres, se compara cada posible combinación de dos filas (o columnas) entre los dos clústeres. La distancia entre los clústeres es la misma que la distancia entre las dos filas (o columnas) de los clústeres más distantes. - Método de Ward
El método de Ward sirve para calcular la suma incremental de cuadrados. La distancia euclidiana semicuadrada es la única medida de distancia que se puede usar con este método de agrupación en clúster. Por lo tanto, la medida de distancia se establece automáticamente con el valor Distancia euclidiana semicuadrada cuando se selecciona el método de Ward.
Tema principal: Agrupación jerárquica en clúster