Dendrogramme und Clustering
Ein Dendrogramm ist ein in Baumform strukturiertes Diagramm, das in Wärmekarten verwendet wird, um das Ergebnis einer hierarchischen Clustering-Berechnung zu visualisieren. Das Ergebnis eines Clusterings wird abhängig von den ausgewählten Distanzmaßen entweder als Entfernung oder Ähnlichkeit zwischen den geclusterten Zeilen oder Spalten dargestellt.
Zeilendendrogramme

Die einzelnen Zeilen der geclusterten Daten werden im Zeilendendrogramm durch die Knoten ganz rechts dargestellt, die Endknoten. Jeder Knoten des Dendrogramms steht für ein Cluster aller Zeilen, die im Dendrogramm rechts des Knotens liegen. Der ganz linke Knoten des Dendrogramms steht daher für ein Cluster, das alle Zeilen enthält. Die vertikale gepunktete Linie ist die Beschneidungslinie. Sie kann im Dendrogramm zur Seite gezogen werden. Die Werte neben der Beschneidungslinie geben an, wie viele Cluster ab der aktuellen Position der Linie vorhanden sind, sowie die berechnete Entfernung oder Ähnlichkeit für diese Position. Im obigen Beispiel beträgt die berechnete Entfernung 1,59, und ab der Position der Beschneidungslinie sind drei Cluster vorhanden. Die oberen beiden Cluster, gekennzeichnet durch pinkfarbene Kreise, enthalten mindestens zwei Zeilen, während das untere Cluster nur eine einzelne Zeile enthält.
Spaltendendrogramme

Im obigen Beispiel sind ab der Position der Beschneidungslinie zwei Cluster vorhanden. Das linke Cluster enthält zwei Spalten, während das Cluster ganz rechts nur eine einzelne Spalte enthält. Die berechnete Entfernung beträgt 6,08.
Interaktion mit Dendrogrammen

Clustering

Sie können das Dendrogramm mithilfe der Visualisierungseigenschaften auf verschiedenen Seiten der Visualisierung positionieren und andere Aktualisierungen an den Einstellungen vornehmen. Die Option Logarithmische Skala verwenden ändert die Skala von einer linearen Skala in eine logarithmische Skala zur Basis 10, log10 (x), und Beschneidungslinie anzeigen gibt an, ob die Beschneidungslinie im Dendrogramm angezeigt werden soll. Sie können auch die Optionen Farbe der Beschneidungslinie, Erste Alternativfarbe für Cluster und die Zweite Alternativfarbe für Cluster in den Eigenschaften festlegen.
Importieren und Exportieren von Dendrogrammen
Alle Dendrogramme in Spotfire können in Form einer Datentabelle dargestellt werden. Dadurch können verschiedene Clustering-Methoden und statistische Berechnungen durchgeführt werden, die über diejenigen im Dialogfeld Clusteringeinstellungen bearbeiten hinausgehen. Sie können beispielsweise Datenfunktionen verwenden, um ein benutzerdefiniertes R-Skript auszuführen, das ein Clustering mit einer Methode Ihrer Wahl durchführt. Insbesondere können Sie beliebige Berechnungen nutzen, durch die Endknoten hierarchisch geordnet werden können. Das Ergebnis eines solchen Vorgangs ist eine Datentabelle, die Sie zur Analyse hinzufügen und dann in die Wärmekarte importieren können, um ein Dendrogramm anzuzeigen.
Ein weiterer Grund für das Exportieren eines Dendrogramms in eine Datentabelle und den späteren Rückimport ist eine verbesserte Leistung. Wenn Sie eine Clusteringmethode auf einen sehr großen Datensatz anwenden, können die Berechnungen einige Zeit dauern. Sobald Sie eine Clusteringmethode einmal durchgeführt haben und diese im Dendrogramm verwendet wird, können Sie das Dendrogramm exportieren und später wieder importieren, ohne das Clustering erneut durchführen zu müssen.
Bei der Datentabellendarstellung eines Dendrogramms in Spotfire muss ein bestimmtes Format eingehalten werden. Dieses Format wird in Format der Dendrogrammdatentabelle beschrieben.
Bezüglich R
R ist unter separaten Open Source-Softwarelizenzbestimmungen verfügbar und ist nicht Bestandteil von Spotfire. Somit ist R nicht durch die Lizenz von Spotfire abgedeckt. Cloud Software Group, Inc. leistet für R keinerlei Unterstützung, Wartung oder Garantie. Das Herunterladen und die Nutzung von R liegt vollständig in Ihrer eigenen Verantwortung und unterliegt den Open Source-Lizenzbestimmungen von R.
- Format der Dendrogrammdatentabelle
Ein Dendrogramm kann über eine Datentabelle importiert und in einer Wärmekarte verwendet werden, sofern es dem in diesem Thema angegebenen Format entspricht.