Hive JDBC データ ソースへの接続

このトピックでは、Hive データ ソースを TIBCO Data Science - Team Studio の JDBC 接続として使用できるようにする方法について説明します。

JDBC データ ソースとして Hive をサポートする Hadoop ディストリビューションについては、「システム要件」を参照してください。
    手順
  1. 適切な Hive JAR ファイルを ~/ALPINE_DATA_REPOSITORY/jdbc_driver/Public フォルダと $CHORUS_HOME/shared/libraries フォルダに配置します。必要な JARS のリストは次のとおりです。
    • commons-logging-*.jar
    • hive-common*.jar
    • hive-exec*.jar
    • hive-jdbc*.jar
    • hive-metastore*.jar
    • hive-service*.jar
    • httpclient*.jar
    • httpcore*.jar
    • libfb303*.jar
    • libthrift*.jar
    • log4j*.jar
    • slf4j-api*.jar

    「*」 は、ベンダーによってバージョンが異なる可能性があることを示します。これらの JAR はすべて、ベンダーのインストールから入手できるはずです。

CDH、HDP、または PHD 上の Hive JDBC

    手順
  1. アスタリスク * の付いた必須フィールドに入力します。
    • データ ソース名: データ ソースのユーザー向けの名前を設定します。自由に選ぶことができます。
    • 説明: このデータ ソースに関する情報を含むオプションのテキストを入力します。
    • Hadoop バージョン: Hive サーバーを実行している Hadoop のディストリビューション。CDH5、HDP、および PHD がサポートされている Hadoop ディストリビューションです。注: $CHORUS_HOME/shared/ALPINE_DATA_REPOSITORY/jdbc_driver/Public/ および $CHORUS_HOME/shared/libraries にコピーされた JAR ファイルは、ここで選択した Hadoop ディストリビューションと一致する必要があります。
    • JDBC URL: データ ソースへの接続に使用される JDBC URL。
      • CDH: URL は jdbc:hive2://SERVER_HOSTNAME:PORT の形式である必要があります。
      • HDP: URL は jdbc:hive2://SERVER_HOSTNAME:PORT/default?stack.name=hdp;stack.version=<hdpversion> の形式である必要があります。
      • PHD: URL は jdbc:hive2://SERVER_HOSTNAME:PORT/default?stack.name=phd;stack.version=<phdversion> の形式である必要があります。
    • 認証: TIBCO Data Science - Team Studio 標準のパスワード認証とKerberos認証をサポートしています。Hive サーバーで構成されている認証の種類を選択します。
      • データベース アカウント および データベース パスワード: [アカウント/パスワード] 認証タイプが選択されている場合は、Hive メタストア アカウントとパスワードを入力します。デフォルトでは、Hive は hive のアカウントと hive のパスワードを使用します。
      • Kerberos: Kerberos 認証タイプが選択されている場合は、Kerberos Principal と Kerberos Keytab の場所を入力します。Kerberos Principal には、Hive サーバーにアクセスする権限が必要です。通常は、hive/myHadoopcluster.com@mycompany.com です。
    • データベース認証情報を共有アカウントとして設定する: 認証タイプが [アカウント/パスワード] に設定されている場合、データベース認証情報を共有するオプションが利用可能です。 [データベースの認証情報を共有アカウントとして設定する] をオンにすると、すべてのユーザーが自分の認証情報を提供せずにデータ ソースにアクセスできます。ユーザーは、データ ソースの所有者としてあなたの認証情報を使用してデータベースにアクセスします。このボックスをオンにしない場合、各ユーザーは、そのデータ ソースにアクセスするために、そのデータ ソースに対する独自の資格情報を入力する必要があります。変更が必要なときは、後でこの設定を変更できます。