Spotfire® 用户指南

Cloudera Impala 连接器 - 功能和设置

可以使用 Cloudera Impala 连接器连接到 Cloudera Impala 数据库并访问其中的数据。在此页面上,可以了解相关功能、可用设置以及处理与 Cloudera Impala 的数据连接时的注意事项。

页面内容

连接器功能

当您使用 Cloudera Impala 连接器访问数据时,可以使用以下功能。

功能 支持?
加载方法
  • 导入(内存中)
  • 外部(数据库内)
  • 按需
自定义查询
预存程序
自定义连接属性
使用身份提供程序进行单点登录
在 Web 客户端中编写
包含在 Linux 上的 Spotfire 发行版中

数据源属性

以下是在使用 Cloudera Impala 连接器创建数据连接时可以配置的受支持的数据源属性。

选项 说明
服务器

您的数据所在的服务器名称。若要包含端口号,请将其直接添加在名称的后面,前面带有冒号。

示例:MyDatabaseServer:20011

默认端口号:21050

身份验证方法 当登录到数据库时要使用的身份验证方法。包括以下选项:
  • 无身份验证
  • Kerberos
  • 用户名
  • 用户名和密码
使用 Spotfire 用户名作为委派用户

使用当前 Spotfire 用户的用户名作为委派用户 (DelegationUID) 连接到数据源。

要使用具有委派的连接,Impala 系统中必须有与您的 Spotfire 用户名对应的用户。

注: 如果您离线运行 Spotfire,而未连接到服务器,则会忽略此设置。
提示: 可以通过将 DelegationUID 设置为自定义属性来指定其他委派用户。如果为 DelegationUID 指定固定值,则无法使用“使用 Spotfire 用户名作为委派用户”设置。
领域 [仅适用于 Kerberos 身份验证。]

Kerberos 中的领域类似于域名。Kerberos 领域名称区分大小写,并且通常为大写。

如果已经为 Kerberos 设置配置了默认领域,则将该字段留空。

如需获取详细信息和进一步帮助,请联系您的 Cloudera Impala 系统管理员。

主机 FQDN [仅适用于 Kerberos 身份验证。]

完全限定域名 (FQDN) 是服务器的完整 URL 或路径。

例如:

myServer.myDomain.com

若要使用 Impala 服务器主机名作为 FQDN,请键入 _HOST

如需获取详细信息和进一步帮助,请联系您的 Cloudera Impala 系统管理员。

服务名称 [仅适用于 Kerberos 身份验证。]

Impala 服务器的服务名称。例如,“impala”。

如需获取详细信息和进一步帮助,请联系您的 Cloudera Impala 系统管理员。

Use SSL 选择使用安全套接层 (SSL) 进行连接。
允许公用名称与主机名不匹配

如果选择“使用 SSL”,则允许连接到主机名与 SSL 证书中的公用名称不匹配的 Impala 服务器。

允许自签名证书 如果选择“使用 SSL”,则允许使用自签名 SSL 证书连接到 Impala 服务器。
使用 SASL

选择使用简单身份验证和安全层 (SASL) 进行连接。

注: 如果选择了“更多属性”下的传输模式选项“HTTP”,则该选项优先于针对 SASL 所做的选择。不能同时使用 SASL 和传输模式 HTTP。
连接超时(秒)

指定与数据库建立连接允许的最大秒数。

默认值为 120。

注: 如果将连接超时设为零,则被视为永不超时。即,尝试连接时不设上限。通常不建议采取这种做法。
命令超时 (秒)

指定执行命令允许的最大秒数。

默认值为 1800。

注: 如果将命令超时设为零,则被视为永不超时。即,尝试执行命令时不设上限。通常不建议采取这种做法。
传输模式

当连接到数据源时,选择要在 Thrift 层中使用的 Thrift 传输模式。

包括以下选项:

  • Binary
    “二进制”是默认传输模式。如果未选择“使用 SASL”和传输模式“HTTP”,则使用“二进制”。
    注: 如果已选择“使用 SASL”选项,则该选项优先于传输模式选项“二进制”
  • HTTP
    当在客户端和服务器之间使用代理时,例如,为了负载平衡,通常需要传输模式“HTTP”。选择“HTTP”时,还必须配置“HTTP 路径”。
    注: 如果选择“HTTP”,则该选项优先于“使用 SASL”选项。
HTTP 路径

指定与要连接到的 Impala 服务器对应的部分 URL。

此部分 URL 会附加到在“服务器”字段中指定的主机和端口。它们共同构成了完整的地址。

例如,如果要连接到 https://example.com:21050/gateway/sandbox/impala/version,则在“服务器”字段中输入 https://example.com:21050,在“HTTP 路径”字段中输入 /gateway/sandbox/impala/version

Cloudera Impala 连接数据源的自定义属性

以下是允许用作 Cloudera Impala 连接数据源中自定义属性的默认驱动程序设置列表。要了解如何更改允许的自定义属性,请参见控制允许哪些属性

默认允许的自定义属性

AsyncExecPollInterval, AutoReconnect,DefaultKeytabFile, DelegationUID, DelegationUserIDCase, 
DisableOptimizedEncodingConverter, EnableQueryRetry, GlobalResultSetCache, HTTPAuthCookies, http.header., 
IgnoreTransactions, LCaseSspKeyName, MaxCatalogNameLen, MaxColumnNameLen, MaxNumQueryRetries, 
MaxSchemaNameLen, MaxTableNameLen, Min_TLS, ProxyHost, ProxyPort, ProxyPWD, ProxyUID, QueryRetryInterval,
ResultSetCacheSize, RowsFetchedPerBlock, ServicePrincipalCanonicalization, SocketTimeout, 
SSOWebServerTimeout, StringColumnLength, TSaslTransportBufSize, TrustedCerts, UPNKeytabMappingFile, 
UseKeytab, UseNativeQuery, UseOnlySSPI, UseProxy, UseSQLUnicodeTypes

受支持的数据类型

设置到外部数据源的连接时,Spotfire 需要将数据源中的数据类型映射到 Spotfire 中的数据类型。以下是 Cloudera Impala 连接器支持的数据类型及其在 Cloudera Impala 数据库中的对应数据类型。

数据库数据类型 Spotfire 数据类型
BOOLEAN Boolean/Bool
TIMESTAMP DateTime
INT Integer/Int
SMALLINT Integer/Int
TINYINT Integer/Int
BIGINT LongInteger/Long
DOUBLE Real/Double
FLOAT SingleReal/Float
CHAR String
STRING String
VARCHAR String
DECIMAL(p,s)

当 p <= 9 并且 s = 0 时:Integer

当 9 < p <= 18 并且 s = 0 时:LongInteger

其他:Real

支持的函数

支持的函数是指您在处理数据库中的数据表时可以使用的函数,例如在计算的列和自定义表达式中使用。

注: 您的数据库可能无法使用某些受支持的函数。这取决于数据库中可用的函数,不同数据库版本和类型之间通常会有差异。

以下是 Cloudera Impala 连接器支持的函数。

函数类型 支持的函数
日期和时间 DATE_ADD, DATE_SUB, DATEDIFF, DAYOFMONTH, FROM_UTC_TIMESTAMP, HOUR, MINUTE, MONTH, NOW, SECOND, TO_DATE, TO_UTC_TIMESTAMP, WEEKOFYEAR, YEAR, QUARTER
转换 SN
数学 ABS, ACOS, ASIN, ATAN, BIN, CEIL, CEILING, COS, DEGREES, E, EXP, HEX, LOG, LOG10, LN, LOG2, NEGATIVE, PI, PMOD, POSITIVE, POW, POWER, QUOTIENT, RADIANS, RAND, ROUND, SIGN, SIN, SQRT, TAN, UNHEX
运算符 %, -, +, *, /
统计 SUM, AVG, MIN, MAX, COUNT
文本 ASCII, CONCAT, CONCAT_WS, INSTR, LENGTH, LOCATE, LOWER, LCASE, LTRIM, REGEXP_EXTRACT, REGEXP_REPLACE, REVERSE, RTRIM, TRIM, UPPER, UCASE

以下函数也受支持,但使用时性能较低:

SPACE, RPAD, LPAD, REPEAT, SUBSTR, SUBSTRING

不支持的函数
以下几个函数可能会在分析中显示,即便此连接器并不支持它们:通配符包括:
INITCAP, TRANSLATE, CONV, GREATEST, LEAST, DAYNAME, DAYOFWEEK
此连接器也不支持合并功能。