協調フィルター予測器

トレーナーによって作成された協調フィルタリング モデルを使用して、製品の予測評価を出力します。Collaborative Filter Trainer によってトレーニングされたモデルとデータセットの両方を使用します。

情報一覧

パラメーター

説明
カテゴリー 予測
データ ソース タイプ HD
出力を他のオペレーターに送信 はい
データ処理ツール Spark

入力

協調フィルター トレーナー オペレーターと、ユーザー ID と製品 ID のカラムを含む表形式のデータセットからの出力。

構成

パラメーター 説明
ノート このオペレーターのパラメーター設定に関するメモまたは役立つ情報。 [ノート] フィールドに内容を入力すると、オペレーターに黄色のアスタリスクが表示されます。
ユーザー列 ユーザー ID を含むデータセット内の列。
製品列 製品 ID を含むデータセット内の列。
出力ディレクトリ 出力ファイルを保存する場所。
出力名 結果を含める名前。
出力を上書き そのパスにある既存のデータを削除するかどうかを指定します。
  • はい - パスが存在する場合は、そのファイルを削除し、結果を保存します。
  • いいえ - パスがすでに存在する場合は失敗します。
ストレージ フォーマット 結果を保存する形式を選択します。保存形式はオペレーターの種類によって決まります。

一般的な形式は、AvroCSVTSV、または Parquet です。

圧縮 出力の圧縮のタイプを選択します。

利用可能な Parquet 圧縮オプション。

  • GZIP
  • Deflate
  • Snappy
  • 圧縮なし

利用可能な Avro 圧縮オプション。

  • Deflate
  • Snappy
  • 圧縮なし
高度な Spark 設定の自動最適化
  • [はい] は、デフォルトの Spark 最適化設定の使用を指定します。
  • [いいえ] を選択すると、カスタマイズされた Spark 最適化を提供できます。 [設定の編集] をクリックして、Spark の最適化をカスタマイズします。詳細については、「詳細設定ダイアログ」を参照してください。

出力

ビジュアル出力

データ出力
各製品/ユーザーの予測評価を説明する追加のカラムを含む HDFS データセット。