Amazon RedShift データ ソースへの接続
TIBCO Data Science - Team Studio を Amazon RedShift データ ソースに接続できます。
このタスクは、TIBCO Data Science - Team Studio サーバーがインストールされているコンピューター上で行います。
始める前にTIBCO Data Science - Team Studio サーバーへの書き込みアクセス権が必要です。Amazon RedShift 設定ファイルへのアクセス権も必要です。
- 手順
- RedShift ドライバーを次のディレクトリにコピーします。そして、これらのコピーの所有権を、TIBCO Data Science - Team Studio を実行するユーザーに変更します(通常は、ユーザー「Chorus」)。
- $CHORUS_HOME/shared/ALPINE_DATA_REPOSITORY/jdbc_driver/Public
- $CHORUS_HOME/shared/libraries
- これらのコピーの所有権を、TIBCO Data Science - Team Studio を実行するユーザーに変更します。
通常、このユーザー名は
「Chorus」です。 - $CHORUS_HOME/shared/ALPINE_DATA_REPOSITORY/jdbc/redshift という名前の新しい redshift ディレクトリを作成します。
- ファイル driver.properties をディレクトリ $CHORUS_HOME/shared/ALPINE_DATA_REPOSITORY/jdbc/default から新しく作成した redshift ディレクトリにコピーします。
- ファイル $CHORUS_HOME/shared/ALPINE_DATA_REPOSITORY/jdbc/redshift/driver.properties の内容を次のように編集します。
# Specify the JDBC class driver for the desired database type. # Examples: # Oracle = oracle.jdbc.driver.OracleDriver # Greenplum = org.postgresql.Driver # DB2 = com.ibm.db2.jcc.DB2Driver # Netezza = org.netezza.Driver # PostgreSQL = org.postgresql.Driver # SQLServer = com.microsoft.sqlserver.jdbc.SQLServerDriver # MySQL = com.mysql.jdbc.Driver # Teradata = com.teradata.jdbc.TeraDriver # Vertica = com.vertica.jdbc.Driver # Sybase = com.sybase.jdbc2.jdbc.SybDriver # Informix = com.informix.jdbc.IfxDriver # SAPDB = com.sap.dbtech.jdbc.DriverSapDB # InterBase = interbase.interclient.Driver # HSqlDB = org.hsqldb.jdbcDriver # MariaDB = org.mariadb.jdbc.Driver # MySQL = com.mysql.jdbc.Driver driverClass=com.amazon.redshift.jdbc41.Driver
- ファイル Additional_jdbc_drivers.rb を見つけて開き、編集します。
このパスは、/data/chorus/install/releases/5.9.1.0.3973-5d95f7c97/components/core/app/mixins/sequel/extensions/Additional_jdbc_drivers.rb のようなパスと似ています。
redshiftクラスの行を追加し、内容が次のようになります。module Sequel module AdditionalJdbcDrivers MAP = { mariadb: ->(db) { org.mariadb.jdbc.Driver }, teradata: ->(db) { com.teradata.jdbc.TeraDriver }, vertica: ->(db) { com.vertica.jdbc.Driver }, hive2: ->(db) { org.apache.hive.jdbc.HiveDriver }, hive: ->(db) { org.apache.hadoop.hive.jdbc.HiveDriver }, redshift: ->(db) { com.amazon.redshift.jdbc41.Driver } } MAP.each do |key, driver| ::Sequel::JDBC::DATABASE_SETUP[key] = driver end end end重要: TIBCO Data Science - Team Studio のアップグレード後に、この変更をファイル Additional_jdbc_drivers.rb に再度適用する必要があります。- TIBCO Data Science - Team Studio を再起動します。
- [データ ソースの追加] ダイアログを開きます。
- [データ ソース タイプ]、[データ ソース名]、および [説明] (オプション)を指定します。
- 次のような URL を使用してデータ接続 (JDBC URL) を設定します。
ヒント: RedShift URL は AWS RedShift ページからコピーできます。
jdbc:redshift://armen-jjredshift.csyb6t8bifc8.us-west-1.redshift.amazonaws.com:5439/armenjjdb
- すべてのユーザーが自分の認証情報を使用せずにデータ ソースにアクセスできるようにする場合は、[データベース認証情報を共有アカウントとして設定する] を選択します。
ユーザーは、データ ソース所有者としての資格情報を使用してデータベースにアクセスします。このチェックボックスを選択しない場合、各ユーザーはそのデータ ソースにアクセスするために資格情報を提供する必要があります。必要になった場合は、後でボックスをオンにすることができます。