TIBCO Data Science - Team Studio 構成プロパティ

Chorus コンテナ内の chorus.properties ファイルを使用して、 TIBCO Data Science - Team Studio を設定します。

設定ファイルとそれに付随するサンプル ファイルは <installation directory>/shared/ ディレクトリにあります。サンプル ファイル chorus.properties.example には、chorus.properties で設定できるすべてのプロパティの例が含まれています。このサンプル ファイルを使用して、chorus.properties で設定可能なプロパティを学ぶことができます。設定ファイルには、このサンプル ファイルにある属性をすべて含めることができます。

ノート:chorus.properties で行った変更を有効にするために、TIBCO Data Science - Team Studio を再起動します。
chorus.properties オプション
プロパティ デフォルト設定 説明
java_options -Djava.library.path =$CHORUS_HOME/vendor /hadoop/lib/ -server -Xmx4096m XX:MaxPermSize=128 TIBCO Data Science - Team Studio アプリケーションの実行時に Java コマンドラインに含めるコマンドライン オプション。
workflow.url http://localhost:8070 TIBCO Data Science - Team Studio とともにインストールされる TIBCO Data Science - Team Studio サーバーのURL。URL には、IP アドレスまたは完全修飾マシン名を指定できます。どちらを使用する場合でも、ブラウザからアクセスできる必要があります。

TIBCO Data Science - Team Studio のインストール後にポート番号を変更する必要がある場合は、必ず TIBCO Data Science - Team Studio Tomcat サーバー設定ファイル、$CHORUS_HOME/alpine/apache-tomcat-7.x.x/conf/server.xml でポート番号を変更してください。<Service name="Catalina"> エレメントの下で、属性 protocol="HTTP/1.1"<Connector> エレメントを探します。

smtp.address loalhost TIBCO Data Science - Team Studio がユーザーへの電子メール通知の配信に使用する SMTP 接続を設定します。SMTP サービスのネットワークアドレスを設定します。
smtp.port 587 TIBCO Data Science - Team Studio がユーザーへの電子メール通知の配信に使用する SMTP 接続を設定します。SMTP サービスのポートを設定します。
smtp.user_name USER_NAME TIBCO Data Science - Team Studio がユーザーへの電子メール通知の配信に使用する SMTP 接続を設定します。
smtp.password PASSWORD TIBCO Data Science - Team Studio がユーザーへの電子メール通知の配信に使用する SMTP 接続を設定します。
smtp.authentication login TIBCO Data Science - Team Studio がユーザーへの電子メール通知の配信に使用する SMTP 接続を設定します。
smtp.enable_starttls_auto false TIBCO Data Science - Team Studio がユーザーへの電子メール通知の配信に使用する SMTP 接続を設定します。
mail.enabled FALSE [true] の場合、TIBCO Data Science - Team Studio は、ジョブの完了と失敗の通知を電子メールでユーザーに配信します。
mail.from FROMNAME <noreply@chorus.com> 電子メール メッセージに from ヘッダーを設定します。
mail.reply_to REPLY NAME <noreply@chorus.com> 電子メール メッセージに reply_to ヘッダーを設定します。
sandbox_recommended_size_in_gb 5 サンドボックス関連の設定。デフォルトの単位は GB です。

ノート:この値は、ワークスペースのサンドボックスが推奨サイズを超えたときを示す視覚的なインジケーターを提供します。

worker_threads 200 Web サーバーとワーカー プロセスのスレッド プール サイズを構成します。
webserver_threads 800 Web サーバーのスレッド数によって、同時 Web リクエストの最大数が決まります。
database_threads 1200 ワーカー スレッドの数によって、同時に実行できる非同期ジョブ (テーブルのコピーやインポートなど) の最大数が決まります。

各 Web スレッドまたはワーカー スレッドは、ローカル PostgreSQL データベースへの独自の接続を使用できます。したがって、worker_threadswebserver_threads の合計は、postgresql.conf で設定された max_connections よりも小さくする必要があります。 max_connections パラメータは、オペレーティング システムのカーネル共有メモリ サイズに基づくことができます。たとえば、OS X では、このパラメータのデフォルトは 20 です。

session_timeout_minutes 480 デフォルトのセッション タイムアウト時間。ログアウトするまでに非アクティブでいられる時間 (分)。
clean_expired_api_tokens_interval_hours 24 6.2 で clean_expired_sessions_interval_hours から名前が変更されました。
delete_unimported_csv_files_interval_hours 1  
delete_unimported_csv_files_after_hours 12  
instance_poll_interval_minutes 5  
reindex_search_data_interval_hours 24  
reindex_datasets_interval_hours 24 データセットのインデックス再作成の頻度を設定します。
reset_counter_cache_interval_hours 24  
file_download.name_prefix n/a このオプションの文字列は、生成されるすべてのファイル名の先頭に付加されます。たとえば、ユーザーがデータセットをダウンロードする場合、ダウンロードされるファイルの名前は、指定されたプレフィックス、データセット名、.csv 拡張子が続きます。プレフィックスの最初の 20 文字のみが使用されます。
file_sizes_mb.workfiles 10 アップロード作業ファイルの最大サイズ。
file_sizes_mb.csv_imports 100 インポートされるファイルの最大サイズ。
file_sizes_mb.user_icon 5 ユーザー アイコンの最大サイズ。
file_sizes_mb.workspace_icon 5 ワークスペース アイコンの最大サイズ。
file_sizes_mb.attachment 10 添付ファイルの最大サイズ。
logging.syslog.enabled false [true] の場合、ログはファイルではなく syslog に書き込まれます。
logging.loglevel info ログに記録するメッセージの最小重大度。 debuginfowarnerror、または fatal のいずれかになります。
oracle.enabled TRUE Oracle データベースの使用を有効にします。
gpfdist.ssl.enabled false データベース間のデータ移動を可能にするには、TIBCO Data Science - Team Studio ホスト上に gpfdist をインストールし、実行する必要があります。2つの gpfdist プロセスを、同じディレクトリを指す異なるポートで起動する必要があります。すべてのセグメントサーバーに SSL 証明書をインストールする必要があります。
gpfdist.url sample-gpfdist-server  
gpfdist.write_port 8000  
gpfdist.read_port 8001  
gpfdist.data_dir /tmp  
tableau.enabled TRUE [false] の場合、他の Tableau パラメーターが指定されている場合でも、Tableau は無効になります。
tableau.url >ip address> Tableau サーバーの URL。URL には、IP アドレスまたは完全修飾コンピュータ名を指定できます。どちらを使用する場合でも、ブラウザからアクセスできる必要があります。
tableau.port 8000 Tableau サーバーのポート。

ノート:このポートは Tableau サーバーで開く必要があります。

tableau.sites marketing,sales Tableau サイトのリスト。TIBCO Data Science - Team Studio は、バージョン 5.3 以降でこのパラメータをサポートします。このオプションが存在しない場合、TIBCO Data Science - Team Studio デフォルトの Tableau サイトにパブリッシュします。
newrelic.enabled false New Relic アプリケーションのパフォーマンス モニタリングを有効にします。詳細については、http://newrelic.com を参照してください。
newrelic.license_key NEWRELIC_LICENSE_KEY  
default_preview_row_limit 500 プレビュー行の最大数。
execution_timeout_in_minutes 60 ワーク ファイルの実行タイムアウト (分単位)。
visualization.overlay_string なし このオプションの文字列は、表示時と保存時の両方で、すべてのビジュアライゼーションに表示されます。

プレフィックスの最初の 40 文字のみが使用されます。

database_login_timeout 10 データベース接続のタイムアウト (秒単位)。Google BigQuery をデータ ソースとして使用し、データベース間で大量のデータをコピーしている場合は、操作が予期せず失敗しないように、この値を増やすことを検討してください。
jdbc_schema_blacklist.postgresql [information_schema, pg_catalog] 表示、インデックス化、検索から除外する PostgreSQL スキーマのリストを指定します。(つまり、実質的にTIBCO Data Science - Team Studio から除外されます)。
jdbc_schema_blacklist.sqlserver [db_accessadmin、db_backupoperator、db_datareader、db_datawriter、db_ddladmin、db_denydatareader、db_denydatawriter、db_owner、db_securityadmin、dbo、INFORMATION_SCHEMA、sys] 表示、インデックス化、検索から除外する SQL Server スキーマのリストを指定します。(つまり、実質的にTIBCO Data Science - Team Studio から除外されます)。
jdbc_schema_blacklist.teradata [All, Crashdumps, DBC, dbcmngr, Default, EXTUSER, LockLogShredder, PUBLIC, SQLJ, SysAdmin, SYSBAR, SYSLIB, SYSSPATIAL, SystemFe, SYSUDTLIB, Sys_Calendar, TDPUSER, TDQCD, TDStats, tdwm, TD_SYSFNLIB, TD_SYSXML] 表示、インデックス化、検索から除外する Teradata スキーマのリストを指定します。(つまり、実質的にTIBCO Data Science - Team Studio から除外されます)。
job_timeout_in_minutes 60

値を 0 に設定すると、この機能はバイパスされます。それ以外の場合、ワーカー プロセスは、設定された時間が経過した後に [スケジュール済み] にリセットされます。

ノート:
  1. 設定値がスケジュールされた間隔より大きい場合 (たとえば、ジョブは 1 時間ごとに実行され、 job_timeout_in_ minutes85 に設定されている場合)、ジョブは 停止しません。

  2. job_timeout_in_minutes は、最も長く実行されているスケジュール ジョブより大きくなければなりません(例えば、実行に 1.5 時間かかる有効なジョブは、job_timeout_in_minutes90 より大きくなければなりません)。

  3. ジョブのステータスが [スケジュール済み] にリセットされても、ジョブによって生成されたプロセスは終了しません。ユーザー インターフェイスにジョブが実行されていないことが示されていても、ジョブは完了するかエラーが発生するまで実行され続けます。