フィルター定義ダイアログ

フィルター条件を定義します。

行フィルターは次の 2 つのモードで指定できます。

  • シンプル モード: シンプル テンプレートを使用してフィルターを定義し、カラム、不等号 (「>」 または 「between」など)、および値 (リテラル値やカラム式など) を選択します。
  • スクリプト モード: SQL または Pig スクリプトを使用して、ほぼすべてのフィルター セットを入力します。
ノート: シンプル モードからスクリプト モードに切り替えると、フィルターはスクリプトに変換されます。ただし、スクリプト モードからシンプル モードに切り替えると、スクリプトは失われます。

シンプル モード

シンプル モードの場合、[新しいフィルターの追加] リンクをクリックして、複数の条件フィルターを追加できます。

フィルターを定義するには、列、条件、値または式を選択します。

AND/OR: 各行に対してすべてのフィルターが満たされる必要があるか (AND 条件)、フィルターの 1 つだけが満たされる必要があるか (OR 条件) も指定する必要があります。

シンプル モードの条件
条件 データベース Hadoop
= はい はい
<> はい はい
> はい はい
< はい はい
>= はい はい
<= はい はい
contains はい はい
between いいえ はい
is Null はい はい
is not Null はい はい
is blank いいえ はい
  • フィルター値が数値でない場合は、一重引用符を追加する必要があります。たとえば、status = 'Active' です。
  • フィルター値が数値または式の場合は、引用符を使用する必要はありません (たとえば、start_date = current_date、または customer_id > 37)。
  • フィルター値がカラムであり、カラム名にスペースまたは大文字が含まれている場合は、二重引用符を追加する必要があります (たとえば、"Start Date" - 1)。
スクリプト モード

スクリプト モードでは、フィルターは SQL または Pig スクリプト言語の「where」句として追加されます。

  • WHERE キーワードを追加する必要はありません。
  • ブール式 (AND、OR など) や括弧を使用して複数のフィルターを組み合わせることができます。
  • SQL (DB の場合) または Pig (HD の場合) の WHERE 句内に収まる任意の式を使用できます。
ノート: Hadoop データの場合、フィルター値が 日時 値の場合、他の ISO 形式の 日時 値と比較できます。詳細については、「ISO 日時 形式」を参照してください。

さらに Hadoop の場合、任意の 日時 Pig 関数を GetMonth(datetime)GetDay(datetime) などの 日時 フィールドに適用し、その結果を Row Filter の条件として使用できます。

利用可能な 日時 関連の Pig 関数の完全なリストは、Apache Pig 日時関数 で見つけることができます。

一部の Pig 関数には Null 値の処理に問題があるため、特定の機能については TIBCO Data Science - Team Studio の代替関数を使用することが推奨されます。この場合、メソッド名に「Alpine」を追加するだけです。たとえば、「DaysBetween」は「DaysBetweenAlpine」になります。

Pig の日時関数代替の Pig 日時関数
AddDurationAddDurationAlpine
SubtractDuration SubtractDurationAlpine
MilliSecondsBetweenMilliSecondsBetweenAlpine
SecondsBetween SecondsBetweenAlpine
MinutesBetweenMinutesBetweenAlpine
HoursBetweenHoursBetweenAlpine
DaysBetweenDaysBetweenAlpine
WeeksBetweenWeeksBetweenAlpine
MonthsBetweenMonthsBetweenAlpine
YearsBetweenYearsBetweenAlpine