Cloudera Impala 连接器 - 功能和设置
可以使用 Cloudera Impala 连接器连接到 Cloudera Impala 数据库并访问其中的数据。在此页面上,可以了解相关功能、可用设置以及处理与 Cloudera Impala 的数据连接时的注意事项。
页面内容
连接器功能
当您使用 Cloudera Impala 连接器访问数据时,可以使用以下功能。
功能 | 支持? |
---|---|
加载方法 |
|
自定义查询 | 是 |
预存程序 | 否 |
自定义连接属性 | 是 |
使用身份提供程序进行单点登录 | 否 |
在 Web 客户端中编写 | 是 |
包含在 Linux 上的 Spotfire 发行版中 | 是 |
数据源属性
以下是在使用 Cloudera Impala 连接器创建数据连接时可以配置的受支持的数据源属性。
选项 | 说明 |
---|---|
服务器 |
您的数据所在的服务器名称。若要包含端口号,请将其直接添加在名称的后面,前面带有冒号。 示例: 默认端口号: |
身份验证方法 | 当登录到数据库时要使用的身份验证方法。包括以下选项:
|
使用 Spotfire 用户名作为委派用户 |
使用当前 Spotfire 用户的用户名作为委派用户 ( 要使用具有委派的连接,Impala 系统中必须有与您的 Spotfire 用户名对应的用户。 注: 如果您离线运行 Spotfire,而未连接到服务器,则会忽略此设置。
提示: 可以通过将
DelegationUID 设置为自定义属性来指定其他委派用户。如果为 DelegationUID 指定固定值,则无法使用“使用 Spotfire 用户名作为委派用户”设置。 |
领域 | [仅适用于 Kerberos 身份验证。] Kerberos 中的领域类似于域名。Kerberos 领域名称区分大小写,并且通常为大写。 如果已经为 Kerberos 设置配置了默认领域,则将该字段留空。 如需获取详细信息和进一步帮助,请联系您的 Cloudera Impala 系统管理员。 |
主机 FQDN | [仅适用于 Kerberos 身份验证。] 完全限定域名 (FQDN) 是服务器的完整 URL 或路径。 例如:
若要使用 Impala 服务器主机名作为 FQDN,请键入 如需获取详细信息和进一步帮助,请联系您的 Cloudera Impala 系统管理员。 |
服务名称 | [仅适用于 Kerberos 身份验证。] Impala 服务器的服务名称。例如,“impala”。 如需获取详细信息和进一步帮助,请联系您的 Cloudera Impala 系统管理员。 |
Use SSL | 选择使用安全套接层 (SSL) 进行连接。 |
允许公用名称与主机名不匹配 |
如果选择“使用 SSL”,则允许连接到主机名与 SSL 证书中的公用名称不匹配的 Impala 服务器。 |
允许自签名证书 | 如果选择“使用 SSL”,则允许使用自签名 SSL 证书连接到 Impala 服务器。 |
使用 SASL |
选择使用简单身份验证和安全层 (SASL) 进行连接。 注: 如果选择了“更多属性”下的传输模式选项“HTTP”,则该选项优先于针对 SASL 所做的选择。不能同时使用 SASL 和传输模式 HTTP。
|
连接超时(秒) |
指定与数据库建立连接允许的最大秒数。 默认值为 120。 注: 如果将连接超时设为零,则被视为永不超时。即,尝试连接时不设上限。通常不建议采取这种做法。
|
命令超时 (秒) |
指定执行命令允许的最大秒数。 默认值为 1800。 注: 如果将命令超时设为零,则被视为永不超时。即,尝试执行命令时不设上限。通常不建议采取这种做法。
|
传输模式 |
当连接到数据源时,选择要在 Thrift 层中使用的 Thrift 传输模式。 包括以下选项:
|
HTTP 路径 |
指定与要连接到的 Impala 服务器对应的部分 URL。 此部分 URL 会附加到在“服务器”字段中指定的主机和端口。它们共同构成了完整的地址。 例如,如果要连接到 |
Cloudera Impala 连接数据源的自定义属性
以下是允许用作 Cloudera Impala 连接数据源中自定义属性的默认驱动程序设置列表。要了解如何更改允许的自定义属性,请参见控制允许哪些属性。
默认允许的自定义属性
AsyncExecPollInterval, AutoReconnect,DefaultKeytabFile, DelegationUID, DelegationUserIDCase,
DisableOptimizedEncodingConverter, EnableQueryRetry, GlobalResultSetCache, HTTPAuthCookies, http.header.,
IgnoreTransactions, LCaseSspKeyName, MaxCatalogNameLen, MaxColumnNameLen, MaxNumQueryRetries,
MaxSchemaNameLen, MaxTableNameLen, Min_TLS, ProxyHost, ProxyPort, ProxyPWD, ProxyUID, QueryRetryInterval,
ResultSetCacheSize, RowsFetchedPerBlock, ServicePrincipalCanonicalization, SocketTimeout,
SSOWebServerTimeout, StringColumnLength, TSaslTransportBufSize, TrustedCerts, UPNKeytabMappingFile,
UseKeytab, UseNativeQuery, UseOnlySSPI, UseProxy, UseSQLUnicodeTypes
受支持的数据类型
设置到外部数据源的连接时,Spotfire 需要将数据源中的数据类型映射到 Spotfire 中的数据类型。以下是 Cloudera Impala 连接器支持的数据类型及其在 Cloudera Impala 数据库中的对应数据类型。
数据库数据类型 | Spotfire 数据类型 |
---|---|
BOOLEAN | Boolean/Bool |
TIMESTAMP | DateTime |
INT | Integer/Int |
SMALLINT | Integer/Int |
TINYINT | Integer/Int |
BIGINT | LongInteger/Long |
DOUBLE | Real/Double |
FLOAT | SingleReal/Float |
CHAR | String |
STRING | String |
VARCHAR | String |
DECIMAL(p,s) |
当 p <= 9 并且 s = 0 时:Integer 当 9 < p <= 18 并且 s = 0 时:LongInteger 其他:Real |
支持的函数
支持的函数是指您在处理数据库中的数据表时可以使用的函数,例如在计算的列和自定义表达式中使用。
以下是 Cloudera Impala 连接器支持的函数。
函数类型 | 支持的函数 |
---|---|
日期和时间 | DATE_ADD, DATE_SUB, DATEDIFF, DAYOFMONTH, FROM_UTC_TIMESTAMP, HOUR, MINUTE, MONTH, NOW, SECOND, TO_DATE, TO_UTC_TIMESTAMP, WEEKOFYEAR, YEAR, QUARTER |
转换 | SN |
数学 | ABS, ACOS, ASIN, ATAN, BIN, CEIL, CEILING, COS, DEGREES, E, EXP, HEX, LOG, LOG10, LN, LOG2, NEGATIVE, PI, PMOD, POSITIVE, POW, POWER, QUOTIENT, RADIANS, RAND, ROUND, SIGN, SIN, SQRT, TAN, UNHEX |
运算符 | %, -, +, *, / |
统计 | SUM, AVG, MIN, MAX, COUNT |
文本 | ASCII, CONCAT, CONCAT_WS, INSTR, LENGTH, LOCATE, LOWER, LCASE, LTRIM, REGEXP_EXTRACT, REGEXP_REPLACE, REVERSE, RTRIM, TRIM, UPPER, UCASE 以下函数也受支持,但使用时性能较低:
|
INITCAP, TRANSLATE, CONV, GREATEST, LEAST, DAYNAME, DAYOFWEEK
此连接器也不支持合并功能。