検出ガイド> 検出の使用と構成> 検出でのデータドメインの操作> データドメインの使用
 
データドメインの使用
検出を使用すると、さまざまなパターンで保存されている関連データのインデックスを作成して検出できます。データドメインは、電話番号、社会保障番号、日付などのデータの種類として定義されます。これらの各例では、データはさまざまなパターンで保存される可能性があります。たとえば、800-123-4567や(800)123-4567などのさまざまなパターンでさまざまなデータソースに保存されている電話番号データがある場合、電話番号ドメインを定義して、電話番号が保存されている場合があります。これにより、Discoveryは、パターンが異なる場合でも、関連する電話番号を含むすべての列を検索して照合できます。
1つ以上のデータドメインとそれぞれのパターンのセットを定義できます。インデックス作成および関係の検出中にデータドメインが有効になっている場合、検出はドメイン内のパターンに準拠するデータを検索して照合します。
モデルでは、関係の検出中にデータドメインが有効になっている場合、ドメイン分析の結果として検出された列が示されます。
関係の検出にドメイン分析を使用するには、次のことを行う必要があります。
ドメイン分析を有効にします。ドメイン分析を制御する構成パラメーターについては、データドメインの有効化を参照してください。
データドメインとそのパターンを定義します。 データドメインとパターンの定義を参照してください。
ドメインとパターンの編集
ドメインとパターンの削除
ドメイン定義の保存と読み込み
データドメインの有効化
インデックス作成と検出中にデータドメインを使用するには、最初にデータドメインを有効にする必要があります。
注:インデックスを作成したり、関係の検出を行ったりした場合は、ドメイン分析を有効にしてインデックス作成と関係の検出を実行する前に、まずすべてのインデックスを削除する必要があります。
データドメインを有効にするには
1. スタジオの管理メニューから、構成を選択します。
2. [検出]で、[インデックス作成]ブランチを展開します。
3. 検出にデータドメインを使用の値をTrueに設定します。
4. 適用 をクリックし、次にOKをクリックして構成の変更を適用します。
ドメイン分析の構成パラメーターについては、データドメインの構成を参照してください。
データドメインとパターンの定義
さまざまなパターンで格納される可能性のあるデータのタイプごとに、ドメインを定義してから、ドメインを表すさまざまな方法を説明する1つ以上のパターンを定義する必要があります。
データドメインを定義するには
1. Studioで、ウィンドウの左側にあるDiscoveryタブをクリックします。
2. [ドメイン]タブをクリックします。
Discoveryは、Domainsタブを表示します。このタブでは、データドメインとそのパターンを定義できます。
3. ドメイン定義ファイルを作成した場合は、オプションで[ファイルからロード]をクリックします。 ドメイン定義の保存と読み込みを参照してください。
4. データドメインで、新規をクリックします。
注:データドメインを定義するには、構成パラメーター検出にデータドメインを使用Trueに設定する必要があります。そうでない場合、Discoveryはデータドメインを有効にするように通知します。
Discoveryは、データドメインを定義できるNew Data Domain ダイアログを表示します。
5. データドメインの下に、このデータドメインの名前と説明を入力します。
6. 最初のパターンで、新しいドメインの最初のパターンを定義する必要があります。
名前—パターンの名前または番号を入力します。
一致式—データベースで見つかった文字列と一致すると予想される正規表現を入力します。
変換—正規表現を使用して通常のプログラムによる検索/置換操作を実行する場合に宣言される置換文字列を入力します。ここで、一致式は「検索」式であり、変換式は「置換」式です。
Discoveryがパターン式を解釈および使用する方法の詳細については、パターン式についてを参照してください。
この例は、新しいドメインとその最初のパターンを示しています。
7. [最初のパターン]で[有効]をオンにして、Discoveryがこのパターンに一致するデータを検索するようにします。
8.[OK]をクリックします。
検出により、新しいデータドメインが[ドメイン]タブに表示されます。
9. オプションで、パターンの下の新規をクリックしてこのドメインの別のパターンを定義し、手順6〜8を繰り返します。
必要な数のパターンを定義できます。隣接する有効チェックボックスをオンまたはオフにすることで、個々のパターンを無効または有効にすることもできます。
ドメインとパターンの編集
既存のドメインまたはパターンを編集できます。詳細については、データドメインとパターンの定義を参照してください。
データドメインまたはパターンを編集するには
1. Studioで、ウィンドウの左側にあるDiscoveryタブをクリックします。
2. [ドメイン]タブをクリックします。
3. 編集するドメインまたはパターンを選択します。
4. データドメインまたはパターンの下にある[編集]ボタンをクリックします。
5. ドメインまたはパターンを編集し、[OK]をクリックして変更を保存します。
ドメインとパターンの削除
既存のドメインまたはパターンを削除できます。
データドメインまたはパターンを削除するには
1. Studioで、ウィンドウの左側にあるDiscoveryタブをクリックします。
2. [ドメイン]タブをクリックします。
3. 削除するドメインまたはパターンを選択します。
4. データドメインまたはパターンの下にある削除ボタンをクリックします。
5. 削除を確認します。
ドメイン定義の保存と読み込み
Discoveryで作成したドメイン定義をコンマ区切り値(.csv)ファイルに保存できます。ドメイン定義を含む.csvファイルを作成し、それらをDiscoveryにロードすることもできます。ドメイン定義ファイルの形式は次のとおりです。
すべてのパターンのドメイン名とドメインの説明は、ドメイン内のすべてのパターンのすべての行で繰り返されます。各パターンはテーブルに1行を取得します。ドメインには個別の行はありません。ドメイン名が互いに一致するパターンが存在することを意味します。ドメイン名とパターン名の両方が一意性を定義する2つのキーであると考える場合、テーブルのすべての行は一意である必要があります。