Amazon RedShift データ ソースへの接続

TIBCO Data Science - Team Studio を Amazon RedShift データ ソースに接続できます。

このタスクは、TIBCO Data Science - Team Studio サーバーがインストールされているコンピューター上で行います。
始める前にTIBCO Data Science - Team Studio サーバーへの書き込みアクセス権が必要です。Amazon RedShift 設定ファイルへのアクセス権も必要です。
    手順
  1. RedShift ドライバーを次のディレクトリにコピーします。そして、これらのコピーの所有権を、TIBCO Data Science - Team Studio を実行するユーザーに変更します(通常は、ユーザー「Chorus」)。
    • $CHORUS_HOME/shared/ALPINE_DATA_REPOSITORY/jdbc_driver/Public
    • $CHORUS_HOME/shared/libraries
  2. これらのコピーの所有権を、TIBCO Data Science - Team Studio を実行するユーザーに変更します。

    通常、このユーザー名は 「Chorus」です。

  3. $CHORUS_HOME/shared/ALPINE_DATA_REPOSITORY/jdbc/redshift という名前の新しい redshift ディレクトリを作成します。
  4. ファイル driver.properties をディレクトリ $CHORUS_HOME/shared/ALPINE_DATA_REPOSITORY/jdbc/default から新しく作成した redshift ディレクトリにコピーします。
  5. ファイル $CHORUS_HOME/shared/ALPINE_DATA_REPOSITORY/jdbc/redshift/driver.properties の内容を次のように編集します。
    # Specify the JDBC class driver for the desired database type.
    # Examples:
    # Oracle = oracle.jdbc.driver.OracleDriver
    # Greenplum = org.postgresql.Driver
    # DB2 = com.ibm.db2.jcc.DB2Driver
    # Netezza = org.netezza.Driver
    # PostgreSQL = org.postgresql.Driver
    # SQLServer = com.microsoft.sqlserver.jdbc.SQLServerDriver
    # MySQL = com.mysql.jdbc.Driver
    # Teradata = com.teradata.jdbc.TeraDriver
    # Vertica = com.vertica.jdbc.Driver
    # Sybase = com.sybase.jdbc2.jdbc.SybDriver
    # Informix = com.informix.jdbc.IfxDriver
    # SAPDB = com.sap.dbtech.jdbc.DriverSapDB
    # InterBase = interbase.interclient.Driver
    # HSqlDB = org.hsqldb.jdbcDriver
    # MariaDB = org.mariadb.jdbc.Driver
    # MySQL = com.mysql.jdbc.Driver
    driverClass=com.amazon.redshift.jdbc41.Driver
  6. ファイル Additional_jdbc_drivers.rb を見つけて開き、編集します。

    このパスは、/data/chorus/install/releases/5.9.1.0.3973-5d95f7c97/components/core/app/mixins/sequel/extensions/Additional_jdbc_drivers.rb のようなパスと似ています。

  7. redshift クラスの行を追加し、内容が次のようになります。
    module Sequel
      module AdditionalJdbcDrivers
        MAP =  {
            mariadb: ->(db) { org.mariadb.jdbc.Driver },
            teradata: ->(db) { com.teradata.jdbc.TeraDriver },
            vertica: ->(db) { com.vertica.jdbc.Driver },
            hive2: ->(db) { org.apache.hive.jdbc.HiveDriver },
            hive: ->(db) { org.apache.hadoop.hive.jdbc.HiveDriver },
            redshift: ->(db) { com.amazon.redshift.jdbc41.Driver }
            }
     
            MAP.each do |key, driver|
            ::Sequel::JDBC::DATABASE_SETUP[key] = driver
          end
        end
      end
    重要: TIBCO Data Science - Team Studio のアップグレード後に、この変更をファイル Additional_jdbc_drivers.rb に再度適用する必要があります。
  8. TIBCO Data Science - Team Studio を再起動します。
  9. [データ ソースの追加] ダイアログを開きます。

    Amazon Redshift ダイアログ

  10. [データ ソース タイプ][データ ソース名]、および [説明] (オプション)を指定します。
  11. 次のような URL を使用してデータ接続 (JDBC URL) を設定します。

    ヒント: RedShift URL は AWS RedShift ページからコピーできます。

    jdbc:redshift://armen-jjredshift.csyb6t8bifc8.us-west-1.redshift.amazonaws.com:5439/armenjjdb
  12. すべてのユーザーが自分の認証情報を使用せずにデータ ソースにアクセスできるようにする場合は、[データベース認証情報を共有アカウントとして設定する] を選択します。

    ユーザーは、データ ソース所有者としての資格情報を使用してデータベースにアクセスします。このチェックボックスを選択しない場合、各ユーザーはそのデータ ソースにアクセスするために資格情報を提供する必要があります。必要になった場合は、後でボックスをオンにすることができます。