Cloudera Hive 连接器 - 功能和设置
您可以使用 Cloudera Hive 连接器连接到 Cloudera Hive 数据库并访问其中的数据。在此页面上,可以了解相关功能、可用设置以及使用与 Cloudera Hive 的数据连接时的注意事项。
页面内容
连接器功能
当您使用 Cloudera Hive 连接器访问数据时,可以使用以下功能。
| 功能 | 支持? |
|---|---|
| 加载方法 |
|
| 自定义查询 | 是 |
| 预存程序 | 否 |
| 自定义连接属性 | 否 |
| 使用身份提供程序进行单点登录 | 否 |
| 在 Web 客户端中编写 | 否 |
| 包含在 Linux 上的 Spotfire 发行版中 | 是(如果驱动程序存在) |
数据源属性
以下是在使用 Cloudera Hive 连接器创建数据连接时可以配置的受支持的数据源属性。
| 选项 | 说明 |
|---|---|
| 服务器 |
您的数据所在的服务器名称。若要包含端口号,请将其直接添加在名称的后面,前面带有冒号。默认端口为 10000。 端口号的示例:MyDatabaseServer:10011 注: Cloudera Hive 连接器仅支持 HiveServer2。
|
| 身份验证方法 |
当登录到数据库时要使用的身份验证方法。选项包括:
|
| 领域 | [仅适用于 Kerberos 身份验证。] Kerberos 中的领域类似于域名。Kerberos 领域名称区分大小写,并且通常为大写。 如果已经为 Kerberos 设置配置了默认领域,则将该字段留空。 如需获取详细信息和进一步帮助,请联系您的 Cloudera Hive 系统管理员。 |
| 主机 FQDN | [仅适用于 Kerberos 身份验证。] 完全限定域名 (FQDN) 是服务器的完整 URL 或路径。 例如:
若要使用 Impala 服务器主机名作为 FQDN,请键入 如需获取详细信息和进一步帮助,请联系您的 Cloudera Hive 系统管理员。 |
| 服务名称 | [仅适用于 Kerberos 身份验证。] Hive 服务器的服务名称。例如,“hive”。 如需获取详细信息和进一步帮助,请联系您的 Cloudera Hive 系统管理员。 |
| 连接 | 连接到指定的服务器,并在“数据库”下拉列表中填充可用数据库的列表。 |
| 数据库 | 从下拉列表中选择感兴趣的数据库。 |
| 传输模式 |
当连接到数据库时,选择要在 Thrift 层中使用的 Thrift 传输模式。包括以下选项:
|
| HTTP 路径 |
[仅当选择 HTTP 传输模式时适用。] 指定与要连接到的 Hive 服务器对应的部分 URL。 此部分 URL 会附加到在“服务器”字段中指定的主机和端口。它们共同构成了完整的地址。 例如,要连接到地址 |
受支持的数据类型
设置到外部数据源的连接时,Spotfire 需要将数据源中的数据类型映射到 Spotfire 中的数据类型。以下是 Cloudera Hive 连接器支持的数据类型。
| 数据库数据类型 | Spotfire 数据类型 |
|---|---|
| BOOLEAN | Boolean/Bool |
| TIMESTAMP | DateTime |
| INT | Integer/Int |
| SMALLINT | Integer/Int |
| TINYINT | Integer/Int |
| BIGINT | LongInteger/Long |
| DECIMAL | Real/Double |
| DOUBLE | Real/Double |
| FLOAT | SingleReal/Float |
| ARRAY | String |
| STRING | String |
支持的函数
支持的函数是指您在处理数据库中的数据表时可以使用的函数,例如在计算的列和自定义表达式中使用。
以下是 Cloudera Hive 连接器支持的函数。
| 函数类型 | 支持的函数 |
|---|---|
| 日期和时间 | YEAR, QUARTER, MONTH, WEEK, WEEKOFYEAR, DAY, DAYOFMONTH, HOUR, MINUTE, SECOND, DATEDIFF, DATE_ADD, DATE_SUB, FROM_UTC_TIMESTAMP, TO_UTC_TIMESTAMP, TO_DATE |
| 转换 | SN |
| 数学 | ABS, ACOS, ASIN, ATAN, BIN, CEIL, CEILING, CONV, COS, DEGREES, E, EXP, FLOOR, HEX, LN, LOG, LOG10, LOG2, NEGATIVE, PI, POW, POWER, POSITIVE, PMOD, RADIANS, RAND, ROUND, SIGN, SIN, SQRT, TAN |
| 运算符 | %, -, +, *, / |
| 统计 | SUM, AVG, MIN, MAX, COUNT, UNIQUECOUNT, VARIANCE, VAR_POP, VAR_SAMP, STDDEV_POP, STDDEV_SAMP, CORR, COVAR_POP, COVAR_SAMP, PERCENTILE |
| 文本 | ASCII, CONCAT, CONCAT_WS, INSTR, FIND_IN_SET, GET_JSON_OBJECT, IN_FILE, INSTR, LENGTH, LOWER, LCASE, LPAD, LTRIM, RPAD, RTRIM, TRIM, UPPER, LOCATE, REPEAT, SPACE, REGEXP_REPLACE, REGEXP_EXTRACT, SUBSTR, SUBSTRING, REVERSE, TRANSLATE, PARSE_URL, UCASE |
不支持的函数
此版本连接器不支持以下函数。
日期和时间:FROM_UNIXTIME、UNIXTIMESTAMP
统计:HISTOGRAM_NUMERIC、COLLECT_SET、COLLECT_LIST
文本:
BASE64、CONTEXT_NGRAMS、DECODE、ENCODE、NGRAMS、PRINTF、SENTENCES、SPLIT、STR_TO_MAP、UNBASE64、FORMAT_NUMBER
此连接器不支持集合函数、类型转换函数、条件函数、其他函数和表生成函数。
Cloudera Hive 也不支持合并函数。