Spotfire® 用户指南

Cloudera Hive 连接器 - 功能和设置

您可以使用 Cloudera Hive 连接器连接到 Cloudera Hive 数据库并访问其中的数据。在此页面上,可以了解相关功能、可用设置以及使用与 Cloudera Hive 的数据连接时的注意事项。

页面内容

连接器功能

当您使用 Cloudera Hive 连接器访问数据时,可以使用以下功能。

功能 支持?
加载方法
  • 导入(内存中)
  • 外部(数据库内)
  • 按需
自定义查询
预存程序
自定义连接属性
使用身份提供程序进行单点登录
在 Web 客户端中编写
包含在 Linux 上的 Spotfire 发行版中 是(如果驱动程序存在)

数据源属性

以下是在使用 Cloudera Hive 连接器创建数据连接时可以配置的受支持的数据源属性。

选项 说明
服务器

您的数据所在的服务器名称。若要包含端口号,请将其直接添加在名称的后面,前面带有冒号。默认端口为 10000。

端口号的示例:MyDatabaseServer:10011

注: Cloudera Hive 连接器仅支持 HiveServer2。
身份验证方法

当登录到数据库时要使用的身份验证方法。选项包括:

  • 无身份验证
  • Kerberos 身份验证
  • 用户名身份验证
  • 用户名和密码身份验证
  • 使用 SSL 的用户名和密码身份验证
领域 [仅适用于 Kerberos 身份验证。]

Kerberos 中的领域类似于域名。Kerberos 领域名称区分大小写,并且通常为大写。

如果已经为 Kerberos 设置配置了默认领域,则将该字段留空。

如需获取详细信息和进一步帮助,请联系您的 Cloudera Hive 系统管理员。

主机 FQDN [仅适用于 Kerberos 身份验证。]

完全限定域名 (FQDN) 是服务器的完整 URL 或路径。

例如:

myServer.myDomain.com

若要使用 Impala 服务器主机名作为 FQDN,请键入 _HOST

如需获取详细信息和进一步帮助,请联系您的 Cloudera Hive 系统管理员。

服务名称 [仅适用于 Kerberos 身份验证。]

Hive 服务器的服务名称。例如,“hive”。

如需获取详细信息和进一步帮助,请联系您的 Cloudera Hive 系统管理员。

连接 连接到指定的服务器,并在“数据库”下拉列表中填充可用数据库的列表。
数据库 从下拉列表中选择感兴趣的数据库。
传输模式

当连接到数据库时,选择要在 Thrift 层中使用的 Thrift 传输模式。包括以下选项:

  • Binary
  • SASL 是默认传输模式。
  • HTTP 如果选择 HTTP,还必须在“HTTP 路径”字段中输入部分 URL。
HTTP 路径

[仅当选择 HTTP 传输模式时适用。]

指定与要连接到的 Hive 服务器对应的部分 URL。

此部分 URL 会附加到在“服务器”字段中指定的主机和端口。它们共同构成了完整的地址。

例如,要连接到地址 https://example.com:10002/gateway/sandbox/hive/version:针对“服务器”,输入 https://example.com:10002,针对“HTTP 路径”,输入 /gateway/sandbox/hive/version

受支持的数据类型

设置到外部数据源的连接时,Spotfire 需要将数据源中的数据类型映射到 Spotfire 中的数据类型。以下是 Cloudera Hive 连接器支持的数据类型。

数据库数据类型 Spotfire 数据类型
BOOLEAN Boolean/Bool
TIMESTAMP DateTime
INT Integer/Int
SMALLINT Integer/Int
TINYINT Integer/Int
BIGINT LongInteger/Long
DECIMAL Real/Double
DOUBLE Real/Double
FLOAT SingleReal/Float
ARRAY String
STRING String

支持的函数

支持的函数是指您在处理数据库中的数据表时可以使用的函数,例如在计算的列和自定义表达式中使用。

注: 您的数据库可能无法使用某些受支持的函数。这取决于数据库中可用的函数,不同数据库版本和类型之间通常会有差异。

以下是 Cloudera Hive 连接器支持的函数。

函数类型 支持的函数
日期和时间 YEAR, QUARTER, MONTH, WEEK, WEEKOFYEAR, DAY, DAYOFMONTH, HOUR, MINUTE, SECOND, DATEDIFF, DATE_ADD, DATE_SUB, FROM_UTC_TIMESTAMP, TO_UTC_TIMESTAMP, TO_DATE
转换 SN
数学 ABS, ACOS, ASIN, ATAN, BIN, CEIL, CEILING, CONV, COS, DEGREES, E, EXP, FLOOR, HEX, LN, LOG, LOG10, LOG2, NEGATIVE, PI, POW, POWER, POSITIVE, PMOD, RADIANS, RAND, ROUND, SIGN, SIN, SQRT, TAN
运算符 %, -, +, *, /
统计 SUM, AVG, MIN, MAX, COUNT, UNIQUECOUNT, VARIANCE, VAR_POP, VAR_SAMP, STDDEV_POP, STDDEV_SAMP, CORR, COVAR_POP, COVAR_SAMP, PERCENTILE
文本 ASCII, CONCAT, CONCAT_WS, INSTR, FIND_IN_SET, GET_JSON_OBJECT, IN_FILE, INSTR, LENGTH, LOWER, LCASE, LPAD, LTRIM, RPAD, RTRIM, TRIM, UPPER, LOCATE, REPEAT, SPACE, REGEXP_REPLACE, REGEXP_EXTRACT, SUBSTR, SUBSTRING, REVERSE, TRANSLATE, PARSE_URL, UCASE

不支持的函数

此版本连接器不支持以下函数。

日期和时间:FROM_UNIXTIME、UNIXTIMESTAMP

统计:HISTOGRAM_NUMERIC、COLLECT_SET、COLLECT_LIST

文本:

BASE64、CONTEXT_NGRAMS、DECODE、ENCODE、NGRAMS、PRINTF、SENTENCES、SPLIT、STR_TO_MAP、UNBASE64、FORMAT_NUMBER

此连接器不支持集合函数、类型转换函数、条件函数、其他函数和表生成函数。

Cloudera Hive 也支持合并函数。