予測器 (HD)

値 (または最も高い確率の値) を予測するために、入力回帰、分類、またはクラスタリング モデルを入力データセットに適用します。

情報一覧

パラメーター

説明
カテゴリー 予測
データ ソース タイプ HD
出力を他のオペレーターに送信 はい
データ処理ツール MapReduce

入力カラム名は、依存カラムを除き、モデル トレーニング用に選択されたデータセット内のカラム名と一致する必要があります。

予測操作は、その予測カラムを入力データセットのカラムとともにユーザー指定の予測テーブルに出力します。

オペレーターには、ユーザー指定の出力テーブルに次の予測カラムが含まれます。

  • PRED_<model_abbreviation> - 予測値または最も確率の高い値
  • CONF_<model_abbreviation> - 予測値の信頼度
  • INFO_<model_abbreviation> - 結果に関する情報の辞書
モデルタイプ モデル カラムの略称
分類
  • ナイーブ ベイズ
  • ロジスティック回帰
  • SVM
  • アルパイン フォレスト 分類
  • デシジョン ツリー
  • 注意
  • LOR
  • SVM
  • AFC
  • DT
回帰
  • 線形回帰
  • アルパイン フォレスト 回帰
  • LIR
  • AFR
クラスタリング K 平均法 KM
  • PRED_KM - 予測されたクラスター
  • DIST_KM - クラスターの中心までの距離
  • INFO_KM - 結果に関する情報の辞書

アルゴリズム

予測器 オペレーターは、入力モデル オペレーターから生成されたモデルに基づいて従属変数の値を予測するために使用されます。

入力モデル 予測器が計算するもの
分類アルゴリズム 最も確率の高い値
数値回帰アルゴリズム 予測値
クラスタリングアルゴリズム 予測されるクラスター

入力

入力回帰、分類、またはクラスタリング モデル、およびモデルが適用される入力データセット。

構成

ノート このオペレーターのパラメーター設定に関するメモまたは役立つ情報。 [ノート] フィールドに内容を入力すると、オペレーターに黄色のアスタリスクが表示されます。
結果を保存しますか? 結果を保存するかどうかを指定します。
  • true - 結果が保存されます。
  • false - データセットは保存せずに次のオペレーターに渡されます。
結果ロケーション オペレーターの結果が保存される HDFS ディレクトリ。これはメイン ディレクトリであり、そのサブディレクトリは 結果名で指定されます。 [ファイルの選択] をクリックして Hadoop ファイル エクスプローラー ダイアログ を開き、ストレージの場所を参照します。テキストを直接編集しないでください。
結果名 結果を保存するファイルの名前。
上書き そのパスとファイル名の既存のデータを削除するかどうかを指定します。
  • はい - パスが存在する場合は、そのファイルを削除し、結果を保存します。
  • いいえ - パスがすでに存在する場合は失敗します。
圧縮 出力の圧縮のタイプを選択します。

利用可能な Parquet 圧縮オプションは次のとおりです。

  • GZIP
  • Deflate
  • Snappy
  • 圧縮なし

利用可能な Avro 圧縮オプションは次のとおりです。

  • Deflate
  • Snappy
  • 圧縮なし

出力

ビジュアル出力
表示される出力テーブルまたはビューのデータ行 (最大 2000 行のデータ)。

次の図は、入力構成の例を示しています。