大量データを操作する
大量データを操作するときに、常に特定の操作に時間がかかることがあります。しかし、TIBCO Spotfire では、躊躇することなく別の方法を試すことができます。時間がかかりそうな場合はいつでも操作を取り消すことができます。計算の完了まで待ちたくない場合は、操作をやり直したり、(軸の固有値がより少ないカラムに切り替えるなど) 別の方法に切り替えることができます。
ここで示すいくつかのヒントは、大量のデータテーブルを操作し、分析のパフォーマンスの向上を必要としている場合に役立ちます。
ビジュアライゼーションと分析
- 集計ビジュアライゼーションを起点として、データのフィルターされた小さい部分のみを使用します。分析内に多数のグラフィカル要素がある場合は、表示に少し時間がかかることがあります。このことは、特に、ハードウェア アクセラレーションを許可していない Web クライアントにおいて重要です。
- データを視覚化して同じものを表示できる、代替の方法がないか検討します。別の種類のビジュアライゼーションを使用できるかどうか、あるいは、データを部分的に集計できるかどうかなどを検討してください。たとえば、ビニングを使用することで、散布図のマーカーを集計しつつ、同じように分散を表示できます。ビン スライダーを使用すると、変更に時間がかかるようになるまで、表示するマーカーの数を増やすことができます。
- クロス テーブル内の並べ替えなどは時間がかかります。
- 使用しないフィルターは非表示にするか、削除します (または、必要がない限り、外部カラムのフィルターを作成しないようにします)。
- 多数の固有値を含むカラムを操作する場合は、アイテムフィルターではなく、リスト ボックス フィルターまたはテキスト フィルターを使用します。たとえ使用しない場合でも、アイテムフィルターは表示に手間がかかります。そのようなカラムに対してアイテムフィルターを使用している古い分析ファイルがある場合は、フィルターの種類をリスト ボックス フィルターかテキスト フィルターに手動で変更し、再びファイルを保存することをお勧めします。
- ある種の集計は他の集計よりも時間がかかります。たとえば、可能な場合は、中央値ではなく平均値を使用するようにしてください。
- データ型は、通貨型ではなく実数型を使用します。実数型に通貨フォーマッタを適用できます。
- テキストエリアに多数のフィルターを追加する代わりに、フィルターパネルまたは [分析内のデータ] フライアウトを使用することをお勧めします。テキストエリアに多数のフィルターがあると、分析の反応が遅くなることがあります。
- テキストエリア内の計算値 (ラベル) とスパークラインによって、分析の反応が遅くなることもあります。
- 集計後のビューに対して使用するほうが計算が高速であるため、OVER を含むすべての式について、集計後の式を使用します。
ハードウェア
- 可能な場合は、高速なソリッド ステート ドライブ (SSD) を使用します (データまたは分析がディスクに保存されている場合)。
- 大量データを操作するときは、同一のコンピュータ上で他のアプリケーションを実行しないようにします。
データを読み込む
- カテゴリ カラムで、並べ替え済みの入力を使用します。
- SBDF ファイルからのデータのロードは、TXT ファイルからのロードに比べはるかに高速です。
- データ形式は Short/Wide よりも Tall/Skinny のほうがパフォーマンスが向上することがあります。
- Spotfire にインポートする前に、無効な値を削除します。
- データを外部データ ソースからインポートする場合、インポート前に選択するデータをできるだけ制限します。これにより、インポートが成功する可能性が高くなります。
データのエクスポート
- テーブルのビジュアライゼーションからではなく、データテーブルからエクスポートします。
- TXT ではなく SBDF にエクスポートします。
Web クライアント
- 可能な場合は、ビジュアライゼーションに多くのグラフィカル要素を含めないようにします。
- 可能な場合は、スケジュールされた更新を使用します。
設定 (オンプレミスのみ)
- インストールされたクライアントを使用するアドミニストレータは、(設定の説明」を参照してください。 で) [MarkingWhereClauseLimit] や [MarkingInQueryLimit] の設定を変更できます。制限を緩めると、クエリーのマークに許容される複雑さが小さくなります。このことは、外部データ ソースを操作する際に重要です。詳細については、管理マネージャのヘルプで「
- フィルターの自動作成をオフにします (インストールされたクライアントを使用)。これは、[データテーブルのプロパティ] ダイアログの特定のデータテーブルと、[ツール] > [オプション – 文書] のすべての新しいインメモリ データテーブルに対してオフにすることができます。
API
- ランダム アクセスよりも、繰り返しによるデータ アクセスを優先します。GetValue(rowindex) 形式の API よりも、DataRowCursor API を使用します。
- カスタムの比較元を使用する際は注意してください。使用方法によっては、それらがボトルネックになることがあります。他の方法で問題を解決できないか検討してください。
- 作業に時間がかかり、さらに古いカスタム拡張機能を使用している場合は、それらをリファクタリングできるかどうか、あるいは時間がかかるステップを省略できるかどうか検討してください。一部の API は本質的に低速です。その場合、古いコードをリファクタリングすると効果が見られることがあります。拡張機能を使用せずにロードして、いずれかの拡張機能が原因かどうかを調べてください。
親トピック: Spotfire のデータの種類