フィルター定義ダイアログ
フィルター条件を定義します。
行フィルターは次の 2 つのモードで指定できます。
- シンプル モード: シンプル テンプレートを使用してフィルターを定義し、カラム、不等号 (「>」 または 「between」など)、および値 (リテラル値やカラム式など) を選択します。
- スクリプト モード: SQL または Pig スクリプトを使用して、ほぼすべてのフィルター セットを入力します。
シンプル モードの場合、[新しいフィルターの追加] リンクをクリックして、複数の条件フィルターを追加できます。
フィルターを定義するには、列、条件、値または式を選択します。
AND/OR: 各行に対してすべてのフィルターが満たされる必要があるか (AND 条件)、フィルターの 1 つだけが満たされる必要があるか (OR 条件) も指定する必要があります。
| 条件 | データベース | Hadoop |
|---|---|---|
| = | はい | はい |
| <> | はい | はい |
| > | はい | はい |
| < | はい | はい |
| >= | はい | はい |
| <= | はい | はい |
| contains | はい | はい |
| between | いいえ | はい |
| is Null | はい | はい |
| is not Null | はい | はい |
| is blank | いいえ | はい |
- フィルター値が数値でない場合は、一重引用符を追加する必要があります。たとえば、status = 'Active' です。
- フィルター値が数値または式の場合は、引用符を使用する必要はありません (たとえば、start_date = current_date、または customer_id > 37)。
- フィルター値がカラムであり、カラム名にスペースまたは大文字が含まれている場合は、二重引用符を追加する必要があります (たとえば、"Start Date" - 1)。
スクリプト モードでは、フィルターは SQL または Pig スクリプト言語の「where」句として追加されます。
- WHERE キーワードを追加する必要はありません。
- ブール式 (AND、OR など) や括弧を使用して複数のフィルターを組み合わせることができます。
- SQL (DB の場合) または Pig (HD の場合) の WHERE 句内に収まる任意の式を使用できます。
さらに Hadoop の場合、任意の 日時 Pig 関数を GetMonth(datetime) や
GetDay(datetime) などの 日時 フィールドに適用し、その結果を Row Filter の条件として使用できます。
利用可能な 日時 関連の Pig 関数の完全なリストは、Apache Pig 日時関数 で見つけることができます。
一部の Pig 関数には Null 値の処理に問題があるため、特定の機能については TIBCO Data Science - Team Studio の代替関数を使用することが推奨されます。この場合、メソッド名に「Alpine」を追加するだけです。たとえば、「DaysBetween」は「DaysBetweenAlpine」になります。
| Pig の日時関数 | 代替の Pig 日時関数 |
|---|---|
AddDuration | AddDurationAlpine |
SubtractDuration
| SubtractDurationAlpine |
MilliSecondsBetween | MilliSecondsBetweenAlpine |
SecondsBetween
| SecondsBetweenAlpine
|
MinutesBetween | MinutesBetweenAlpine |
HoursBetween | HoursBetweenAlpine |
DaysBetween | DaysBetweenAlpine |
WeeksBetween | WeeksBetweenAlpine |
MonthsBetween | MonthsBetweenAlpine
|
YearsBetween | YearsBetweenAlpine |