Hadoop 接続の前提条件

このチェックリストは、典型的な Hadoop ベースのインストールで TIBCO Data Science - Team Studio のコンポーネントがすべて説明され、完了していることを確認するために提供されます。

Hadoop 接続構成には、HDFS ホスト、HDFS ポート、Jobtracker ホスト、および Jobtracker ポートが必要です。すべての Hadoop ノードのホスト名は、TIBCO Data Science - Team Studio サーバーから適切なコンピュータに解決する必要があります。TIBCO Data Science - Team Studio は、以下のフォームに入力した内容が無効な場合は、Hadoop 管理者または Hadoop 構成ファイル (*-site.xml) にアクセスできるユーザーが必要です。TIBCO Data Science - Team Studio でも、Hadoop ホスト名が解決しない場合、TIBCO Data Science - Team Studio サーバーのホスト ファイルを変更する必要がある場合があります。

接続の構成と、Hadoop クラスターが Kerberos 用に構成されていない場合のテストには、約 2 時間かかります。設定されている場合、TIBCO Data Science - Team Studio サーバー上で TIBCO Data Science - Team Studio を実行しているユーザーは、Kerberos で認証するためのキー タブを持っている必要があります。TIBCO Data Science - Team Studio は、NameNode と Jobtracker のキー タブが TIBCO Data Science - Team Studio サーバー上にあることを必要とします。これら 3 つの要素のいずれかが欠けているか無効である場合、TIBCO Data Science - Team Studio は、インストール中に連絡可能な Hadoop 管理者を必要とします。Kerberos 用に構成されたクラスタへの初期接続の設定には約 4 時間かかります。

Hadoop クラスター
確認 応答 参考
Hadoop のどのバージョンがインストールされていますか?    
インストール中に Hadoop 管理者が対応できますか?    
リソース マネージャーの NameNode は高可用性に対して有効になっていますか?    
クラスターは Kerberos 用に構成されていますか?    
クラスターは MapReduce (MRv1) または YARN (MRv2) を実行していますか?    
HDFS および JobTracker/リソース マネージャーのホスト名は、TIBCO Data Science - Team Studio サーバーから正しいコンピューターに解決されていますか?   そうでない場合は、これらの Hadoop ホストが適切に解決されるようにホスト ファイルを構成します。
高可用性のない Hadoop クラスター
確認 応答 参考
HDFS のホストとポートとは何ですか?   core-site.xmlfs.default.name: hdfs://HDFSHOST:HDFSPORT として見つかります。
高可用性を備えた Hadoop クラスター
確認 応答 参考
ネームサービスの名前は何ですか?   hdfs-site.xmldfs.nameservices: hdfs://nameservice1 として見つかります。
dfs.ha.namenodes.<nameservice> の値は何ですか?   ネーム サービスの名前を使用して、hdfs-site.xml で見つけることができます。
dfs.namenode.rpc-address.<nameservice>.<namenode> の値は何ですか?   ネーム サービスの名前と前の行で指定した各 NameNode を使用して、hdfs-site.xml で見つけることができます。
dfs.client.failover.proxy.provider.<namerservice> の値は何ですか?   ネーム サービスの名前を使用して、hdfs-site.xml で見つけることができます。
MapReduce (MRv1)
確認 応答 参考
ジョブのホストとポートとは何ですか?   mapred-site.xmlmapred.job.tracker: hdfs://JOBHOST:JOBPORT として見つかります。
YARN (MRv2)
確認 応答 参考
YARN リソース マネージャーのアドレスは何ですか?   yarn-site.xmlyarn.resourcemanager.address として見つかります。
Kerberos (Kerberos が有効になっていない場合は無視します)
確認 応答 参考
TIBCO Data Science - Team Studio サーバーを認証する keytab はありますか?    
TIBCO Data Science - Team Studio サーバーに必要な keytab ファイル(マージされたもの、されていないもの)はありますか?