Spotfire® 用户指南

计算数据关系

数据关系工具用于调查不同列对之间的关系。在已安装的客户端中,可以使用“工具” > “数据关系”计算数据关系。

开始之前

数据关系工具只能在已安装的客户端中使用。

过程

  1. 在菜单栏上,选择“工具” > “数据关系”
  2. “数据关系”对话框中键入“计算名称”或使用默认名称。
  3. 根据要比较的列类型,选择想要使用的“比较方法”
    要了解有关比较方法的更多信息,请参见数据关系理论
  4. 将所需列移至“所选 Y 列”和“所选 X 列”这两个字段。
    从“可用 Y 列”和“可用 X 列”中选择列,然后单击相应的“添加 >”按钮。若要选择多列,请按住 Ctrl 键,并单击列表中的列名称。必须至少为“Y 列”字段和“X 列”字段分别选择一列。单击“< 删除”将列移回可用列列表。
    注: 通常情况下,类别列中不能包含过多唯一值。如果所选列中包含多于 1000 个唯一值,则“方差分析”、“Kruskal-Wallis”和“卡方”选项的所得数据关系表均会显示错误。
  5. 单击“确定”

结果

将使用指定比较名称创建新页面,其中显示了数据关系表和散点图(针对线性回归)、交叉表(针对卡方)或箱线图(针对方差分析和 Kruskal-Wallis)。

如果在执行数据关系计算之后筛选数据,或者使用已更新的链接数据,则数据关系表中的 p 值将不再反映其他图表中的当前选择。在这种情况下,将显示“刷新数据表”图标。

要更新数据关系表,请单击“数据关系”表标题栏中的“刷新数据表”

提示: 您可以使用数据关系表控制其他图表。在数据关系表中,单击所需的列对。表格下方的图表更新为在其轴上显示当前标记的列。
提示: 您可以更改数据关系计算的所得表中显示的列、对表进行排序、更改列宽或重新排列列,就像在任何其他表图表中一样。

示例:检验数据集中的各个数值列是否相关

关于此任务

假设存在以下数据表,其中列出了一群人的一些属性:
Eye color, Gender, Height (m), Weight (kg), Age

blue, female, 1.65, 62.7, 29

blue, female, 1.50, 57.0, 31

blue, female, 1.69, 64.2, 18

blue, male, 1.58, 63.2, 31

green, male, 1.76, 70.4, 44

green, male, 1.82, 72.8, 26

green, male, 1.92, 76.8, 33

green, female, 1.54, 61.6, 39

green, female, 1.76, 70.4, 22

brown, female, 1.67, 66.8, 34

brown, female, 1.47, 58.8, 41

brown, male, 1.69, 71.0, 23

brown, male, 1.78, 74.8, 35

brown, male, 1.83, 76.9, 20

brown, female, 1.62, 87, 62

blue, male, 1.87, 86.5, 23

brown, male, 1.76, 92, 65

brown, male, 1.62, 59, 13

green, female, 1.70, 59, 32

(若要检验此示例,请复制上述所有内容,并将其粘贴到已安装的 Spotfire 客户端中。)

过程

  1. 在菜单栏上,选择“工具” > “数据关系”
  2. “数据关系”对话框中,选择“线性回归(数值与数值)”作为比较方法。
  3. 通过在“可用 Y 列”列表中单击列,然后单击“添加 >”,将所有列都添加到“所选 Y 列”列表。


  4. 通过在“可用 X 列”列表中单击列,然后单击“添加 >”,将所有列都添加到“所选 X 列”列表。


  5. 单击“确定”

结果

将创建新数据关系表,并根据表中标记的行创建散点图。

散点图显示了数据关系表中当前标记行所对应的 Y 列和 X 列。由于在调查的所有列中,身高与体重所得 p 值最低,因此数据关系表中首先列出此列对,并且默认进行标记。检验人员的身高与体重似乎相关,这不足为奇。

通过单击数据关系表中的不同行,散点图更改为显示新的列对:



年龄与身高的 p 值非常大,根据散点图可知,当前数据中的这两列似乎并不显著相关。

要编辑数据关系计算的选定 Y 列和/或 X 列,请单击数据关系表标题栏上的“编辑计算”图标 ,或者在数据画布中找到数据关系数据表,单击节点,然后从步骤列表中选择编辑计算设置:

(要在计算中使用不同的比较方法,必须再次运行该工具。)