Datenaufbereitung in Microsoft Excel

Bevor eine Microsoft Excel-Datei in eine Analyse geladen wird, ist es wichtig, dass die Datenkalkulation keine irrelevanten Informationen enthält und eine gute Struktur hat, um Fehlinterpretationen zu vermeiden. Mögliche Aktionen, die vor dem Laden von Daten ausgeführt werden können, sind das Entfernen von Kontextinformationen und das Kombinieren von mehreren Spalten in eine Spalte.

Das Tabellenformat der Daten in einer Excel-Tabelle wird in Ihrer Analyse als Datentabelle dargestellt. Die erste Zeile mit Daten in der Tabelle wird als Name der Datenspalten in der Tabelle interpretiert, und die folgenden Zeilen werden als Datenzeilen interpretiert.

Entfernen von kontextbezogenen Informationen

Die folgende Abbildung zeigt eine Tabelle mit einigen kontextbezogenen Informationen oberhalb der eigentlichen Datentabelle. Dies führt zur Fehlinterpretation der Daten.

Entfernen Sie alle kontextbezogenen Informationen, bevor Sie die Daten laden, um gute Ergebnisse zu erzielen. Im folgenden Blatt gibt es keine kontextbezogenen Informationen vor dem eigentlichen Datensatz, daher wird er korrekt interpretiert.



Kombinieren von Spalten

Die Daten können auf verschiedene Arten organisiert werden, kurz/breit oder lang/schmal, aber immer noch die gleichen Informationen enthalten. Oft ist es einfacher, Daten im langen/schmalen Format zu visualisieren. Sie können Ihre Daten in Spotfire umwandeln, indem Sie Spalten depivotieren. Wenn Sie diesen Vorgang jedoch in Excel besser ausführen können, können Sie dies auch vor dem Hochladen der Daten in Spotfire tun.

Die folgende Excel-Tabelle enthält beispielsweise die Anzahl der verkauften Eintrittskarten für fünf verschiedene Schalter. Die Daten sind in einem kurzen/breiten Format organisiert, die Tabelle enthält also viele Spalten mit ähnlichen Daten.
Kombinieren von Spalten

In der folgenden Tabelle sind die gleichen Daten im langen/kleinen Format organisiert. Die Werte von den Schaltern wurden in einer Spalte zusammengefasst.