Spotfire 中的数据类型
数据可能来自众多不同来源,而且目前的趋势是一般来源所含的数据越来越多。这些数据来源可能是传统企业数据源、关系数据库、多维数据集、NoSQL、机器生成的数据、云、流数据、暗数据、非结构化数据、Hadoop 中的大数据和 Web 服务等。借助 Spotfire,您可以为来自任何源的任何类型数据提供完美的分析环境。
访问数据的方法有多种:
- 直接文件访问。Spotfire 支持访问来自多种文件类型的数据。某些数据文件只能使用已安装的 Spotfire 客户端打开。文件数据始终在内存中进行分析。
支持的文件格式
- Microsoft Excel 工作薄(.xls、.xlsx、.xlsm、.xlsb)、逗号分隔值 (.csv)、文本 (.txt)、Spotfire 文本数据格式(.stdf、.txt)、Spotfire Server 日志文件 (.log)、Spotfire 二进制数据格式 (.sbdf)、Parquet(.parquet、.parq)、ESRI 形状文件 (.shp)、GeoJSON (.geojson)
- 仅限已安装的客户端:Microsoft Access 数据库(.mdb、.mde、.accdb、.accde)、SAS 数据文件 (.sas7bdat)、通用数据链接 (.udl)
注: 如果您的公司已配置其他文件源,您可能有权访问这些文件源。 - 通过连接器与外部系统建立数据连接。数据连接十分适合处理大数据,而且每个连接器都针对特定数据源量身打造。此外还可以创建自定义查询,优化返回的数据或查询性能。通过数据连接,通常可以选择分析内存中或数据库中的数据。
流数据是数据库中数据的一种特殊用例,数据会实时更新或按某一频率更新,具体取决于如何配置与流数据的连接。与流数据的连接的工作方式与任何其他连接相同。
- 通过信息服务及其配置工具 Information Designer(仅可从已安装的客户端获得),您可以设置任意 JDBC 数据源,以及创建信息链接,这些信息链接是可在内存中分析的预定义 SQL 查询。信息链接可以包括用来提醒最终用户选择他们自己的数据的提示以及可作为前/后查询或主查询添加的程序。内置的 SQL 查询可以轻松编辑,以备日后调整结果。
信息链接在 TIBCO Spotfire Cloud 环境中不可用。
- TIBCO Data Virtualization(也使用 Spotfire Advanced Data Services 作为品牌)是与其他第三方应用程序的接口,通常用于访问 Web 服务。
可以从编写栏上的“文件和数据”浮出控件访问所有类型的源:
来自多个源的数据可以合并成一个 Spotfire 分析,并使用许多不同的图表类型加以分析。如果 Spotfire 检测到新数据与以前添加的数据相似,则在将新数据添加到分析中时,系统会建议您将数据加入到单个数据表中。
来自多个不同来源的数据可以在单个或众多图表中显示。不同数据表可以彼此关联起来,因此在一个数据表中执行的筛选会影响另一个数据表中的值,但它们也可以保持完全独立,不受任何限制。
以下是可用于不同访问类型的不同加载方法和功能的概述。有关详细信息,另请参见加载方法。
支持? | 连接器 | TIBCO Data Virtualization | 信息服务 |
---|---|---|---|
数据库中 | 是 | 是 | – |
内存中 | 是 | 是 | 是 |
按需 | 是 | 是 | 是 |
自定义查询 | 是 | - | 是 |
Spotfire 分析是将来自多个来源的数据综合到单个分析的理想方式。例如,您可以开始时使用少量内存中的数据表,然后再通过仅按需加载的外部数据库中的数据表获取详细信息。来自不同源的数据可单独查看,也可以综合到单个图表中查看。
使用 Spotfire 时,如果需要,您始终可以确保数据为最新。您可以视情况,选择刷新单个数据表、数据表的一部分或重新加载整个分析中的所有数据。有关更多信息,另请参见链接、存储和嵌入的数据。
- 使用较大数据卷
当您使用大量数据时,可能始终会有某些操作执行起来需要耗费一些时间。但是,有了 Spotfire,您无需担心便可尝试不同的选择。如果某一操作可能需要花费较长时间,您随时可以取消该操作。如果您不想等待计算完成,则可以撤消操作,或者切换到不同选择(例如切换到轴上包含较少唯一值的列)。 - 使用数据库中的数据
当您使用来自外部数据源(数据库中或数据库中的数据)的数据时,需要记住很多与使用内存中的数据不同的事项。一些功能的工作方式不同或者不可用。 - 使用流数据
如果要将更新可视化并实时跟踪更新,可以连接到 Spotfire 中的流数据。 - 使用多维数据集
在 Spotfire 中使用多维数据集数据时,有一些必须考虑的问题。 - 使用外部数据行限制
使用数据库内数据时,Spotfire 管理员可配置可检索和图表化的行数限制。此举可以阻止加载大量数据,从而减轻网络、数据库和系统内存压力。此限制会影响图表以及列表框筛选器、层级筛选器和项目筛选器。