建模和清理数据
使用 Spotfire 时,您拥有大量机会去清理、修改和增强数据。
重复使用数据库模型
如果已花费大量时间在数据库中设置关系和构建模型,您自然希望这些工作能在 Spotfire 中派上用场。在配置数据连接或信息链接的过程中定义要查看的视图时,您可以使用已在数据库中定义的所有关系和约束。
您可以将数据连接、信息链接及其元素以及分析文件保存到库中,并重复使用,从而最大限度缩短创建新分析所需的准备时间。
数据处理
通过展开的“分析中的数据”浮出控件,您可以直接更改列的数据类型、格式设置和分类等。根据列的类型,还可以将一列分割为多列,或者使用某一个值替换空值。某些类型的清理也可能会显示为只需单击一下即可应用的推荐。
自定义表达式和计算的列
通过自定义表达式,您可以基于数据表中的列和可用的表达式函数,为图表创建自己的聚合方法。内存中数据表始终可以使用以 Spotfire 表达式语言编写的所有函数,而数据库中数据表可以使用的函数仅限当前连接器提供的函数。但是,使用 THEN 关键字添加将对已聚合数据计算的部分表达式,可以进一步强化功能已然十分强大的自定义表达式。如此一来,您便可以在自己认为合适时对数据建模,并开展无穷次计算。
自定义表达式可根据表达式所含列中的当前筛选值,自由开展各类计算。它们仅影响它们所作用的轴。
计算的列与自定义表达式十分类似,区别在于,它们使用所含列中的所有值,并会向数据表添加一个新列作为计算结果。转换和数据函数
有时候,您要在 Spotfire 中分析的数据并不具备最适当的格式,甚至可能包含错误。因此,对数据执行转换可能有所帮助,从而确保从分析中获得最佳结果。有多种方式可用来转换数据。例如,您可以计算并替换列,更改列名或数据类型,使用数据函数执行预定义统计计算,规范或转置/逆转置数据。
可以在数据加载时应用转换,也可以稍后在数据已加载到 Spotfire 中时应用。您可以对加载到 Spotfire 中的大多数“常规”列类型执行转换,但不能对内容会因您在分析中所做的选择而发生变化的部分列类型执行。
由于有望在数据函数中使用 Spotfire® Enterprise Runtime for R(又名 TERR™)、R 或 Python 的统计功能,您还可利用这一无限潜力,自由设置转换。
统计工具
在已安装的客户端中,还可以将 Spotfire 工具用于数据关系、K 均值聚类、线相似度、层级群集、回归建模和分类建模。