協調フィルター レコメンダー

協調フィルター トレイナーによってトレーニングされたモデルを使用して、それらのユーザーまたは製品に対する推奨事項を出力します。

情報一覧

パラメーター

説明
カテゴリー 予測
データ ソース タイプ HD
出力を他のオペレーターに送信 はい
データ処理ツール Spark

入力

協調フィルター トレイナーからの出力と HDFS データセット。

制限事項

選択したカラムは、ユーザー ID または製品 ID を表す必要があります。

構成

パラメーター 説明
ノート このオペレーターのパラメーター設定に関するメモまたは役立つ情報。 [ノート] フィールドに内容を入力すると、オペレーターに黄色のアスタリスクが表示されます。
リコメンデーションを生成 ユーザーまたは製品 ID を表すデータセット内のカラムを選択します。

ユーザーが好みそうな製品のリストを表示するには、[ユーザー] (デフォルト) を選択します。

製品を好む可能性のあるユーザーのリストを表示するには、[製品] を選択します。

このカラムの表すもの [リコメンデーションを生成] カラムが何を表すかを示します - [ユーザー] (デフォルト) または [製品]
推奨する番号 生成する推奨事項の数を指定します。

範囲: 1 ~ 100

デフォルト値: 5

出力ディレクトリ 出力ファイルを保存する場所。
出力名 結果を含める名前。
出力を上書き そのパスにある既存のデータを削除するかどうかを指定します。
  • はい - パスが存在する場合は、そのファイルを削除し、結果を保存します。
  • いいえ - パスがすでに存在する場合は失敗します。
ストレージ フォーマット 結果を保存する形式を選択します。保存形式はオペレーターの種類によって決まります。

一般的な形式は、AvroCSVTSV、または Parquet です。

圧縮 出力の圧縮のタイプを選択します。

利用可能な Parquet 圧縮オプション。

  • GZIP
  • Deflate
  • Snappy
  • 圧縮なし

利用可能な Avro 圧縮オプション。

  • Deflate
  • Snappy
  • 圧縮なし
高度な Spark 設定の自動最適化
  • [はい] は、デフォルトの Spark 最適化設定の使用を指定します。
  • [いいえ] を選択すると、カスタマイズされた Spark 最適化を提供できます。 [設定の編集] をクリックして、Spark の最適化をカスタマイズします。詳細については、「詳細設定ダイアログ」を参照してください。

出力

ビジュアル出力

この出力では、選択したユーザー カラムの各ユーザー ID が表示され、ユーザーが楽しむ可能性のある 5 つの製品とその予測評価がリストされます。

データ出力
このデータは、ワークフロー内の他のオペレーターによってさらに操作できます。これは、表形式の HDFS データセットとして渡されます。次の例に示すように、結果ペインの サマリー セクションを参照すると、推奨テーブルの保存場所を見つけることができます。