转置数据
转置转换是一种将数据从高/窄格式转换到短/宽格式的方法。数据会被分发到通常聚合值的列中。这意味着,原始数据中的多个值在新数据表的相同位置结束。
示例
以下示例显示了对一个非常简单数据集的转置转换。原始数据表中有三列和四行。每行包含两个百货商店(A 或 B)中的一个、一种产品(TV 或 DVD)以及销售数量的数字值。如果每天添加新行,数据表可能会与此类似。
但是,也许我们会对平均每天每个商店中每种产品的销售数量更感兴趣。
通过使用对这两种产品的数字值取“平均值”的聚合方法,转置数据表之后,我们便可以获得新数据表。此数据表仅有两行,每行针对一个商店。该表的布局已由高/窄格式转换到短/宽格式。如果数据表包含更多产品,则差异会更加显著。在新数据表中,我们可以很容易地看出平均每一天每个商店中所销售产品的数量。第一行说明,某一天百货商店 A 销售了 3 部 TV,但是没有销售出 DVD。然而,百货商店 B 平均每一天可能会销售 6 部 TV 和 8 部 DVD。

示例
在此示例中,我们有一个较大的数据集,包括来自生产小型机械零部件的假设性公司中的数据。其中包括对零部件宽度、高度和厚度的测量。零部件中有三个不同的孔。对这些孔的直径也进行了测量,并包含它们所应出现的小偏差的尺寸。
从包含所有零部件样品尺寸的原始数据表中,我们可以看出该公司三家工厂(A、B 或 C)中的哪一家生产了这些零部件,并了解这些零部件的出厂日期、所属批次以及所有零部件的尺寸。


我们真正感兴趣的是这三家不同的工厂在生产这些零部件时的质量所在。如果我们要将零部件提供给对零部件孔的精确度具有不同需求的不同客户,那么则需要具体了解哪个工厂应向哪个客户供应零部件。然后我们通过转置数据获得每个工厂所对应的一行,并获得零部件不同尺寸的最小值、最大值和平均值。


新列的顺序由按字母顺序排序的命名表达式的结果决定。
将数据导入 Spotfire 之后,便可以开始对其进行分析。通过筛选数据,可以对零部件中孔的直径和偏差所允许的最小和最大尺寸进行设置。


在此分析中,我们可以看出,如果将直径不宜太小视作最重要的条件,那么工厂 A 便能够向要求最高的客户供应零部件。
父主题: 转置数据