Spotfire의 데이터 유형
데이터는 여러 가지 다양한 소스에서 비롯될 수 있으며 더 많은 데이터의 일반적인 보급으로 나아가는 추세입니다. 이는 기존의 엔터프라이즈 소스, 관계형 데이터베이스, 큐브, NoSQL, 기계 생성 데이터, 클라우드, 스트리밍 데이터, 다크 데이터, 비정형 데이터, Snowflake의 빅데이터, Hadoop, 웹 서비스 등 무엇이든 해당할 수 있습니다. Spotfire를 사용하면 어떤 소스의 어떤 유형의 데이터든 분석하기에 완벽한 환경을 갖출 수 있습니다.
다음과 같은 여러 가지 방법으로 데이터에 액세스할 수 있습니다.
- 직접 파일에 액세스. Spotfire는 다양한 유형의 파일에서 데이터에 액세스하는 것을 지원합니다. 일부 데이터 파일은 설치된 Spotfire 클라이언트를 사용해서만 열 수 있습니다. 파일 데이터는 항상 메모리 내에서 분석됩니다.
지원되는 파일 형식
- Microsoft Excel 워크북(.xlsx, .xlsm, .xlsb, .xls), 쉼표로 구분된 값 파일(.csv), 텍스트(.txt), Spotfire 텍스트 데이터 형식(.stdf, .txt), Spotfire 서버 로그 파일(.log), Spotfire 2진 데이터 형식(.sbdf), Parquet(.parquet, .parq), ESRI Shapefile(.shp), GeoJSON(.geojson)
- 설치된 클라이언트만 해당: Microsoft Access 데이터베이스(.mdb, .mde, .accdb, .accde), SAS 데이터 파일(.sas7bdat), 범용 데이터 링크(.udl)
주: 회사에서 추가 파일 소스를 구성했다면 이 파일 소스에 액세스할 수 있습니다. - 데이터 연결(외부 시스템으로의 커넥터를 통해). 데이터 연결은 빅 데이터 처리에 적합하며 각 커넥터는 특정 소스에 맞춰져 있습니다. 사용자 지정 질의는 반환되는 데이터나 질의의 성능을 자세히 조정하기 위해 만들 수 있습니다. 데이터 연결을 사용하면 일반적으로 메모리 내 또는 데이터베이스 내 데이터를 분석하도록 선택할 수 있습니다.
스트리밍 데이터는 스트리밍 데이터에 대한 연결을 구성하는 방법에 따라 데이터가 실시간으로 또는 특정 빈도로 업데이트되는 데이터베이스 내 데이터의 특수한 사례입니다. 스트리밍 데이터에 대한 연결은 다른 모든 연결과 동일한 방식으로 작동합니다.
- 인포메이션 서비스 및 해당 구성 도구 인포메이션 디자이너(설치된 클라이언트에서만 사용 가능)를 사용하면 JDBC 데이터 소스를 설정하고, 메모리 내에서 분석될 수 있는 미리 정의된 SQL 질의인 인포메이션 링크를 만들 수 있습니다. 인포메이션 링크에는 최종 사용자가 자신의 데이터를 선택할 수 있는 프롬프트가 포함될 수 있으며 프로시저는 사전/사후 또는 기본 질의로 추가될 수 있습니다. 기본 제공 SQL 질의를 쉽게 편집하여 결과를 더 자세히 수정할 수 있습니다.
설치된 클라이언트를 서버 없이 실행하는 경우 인포메이션 링크를 사용할 수 없습니다.
- TIBCO Data Virtualization(Spotfire Advanced Data Services라는 브랜드로도 사용됨)은 다른 타사 응용 프로그램에 대한 인터페이스로, 웹 서비스에 액세스하는 데 일반적으로 사용됩니다.
작성 막대의 파일 및 데이터 플라이아웃에서 모든 유형의 소스에 액세스할 수 있습니다.

여러 소스의 데이터를 단일 Spotfire 분석에 결합하여 다양한 시각화 유형을 통해 분석할 수 있습니다. Spotfire가 새 데이터가 이전에 추가된 데이터와 비슷하다는 것을 발견하면, 분석에 새 데이터를 추가할 때 데이터를 단일 데이터 테이블로 조인하라는 권장이 표시됩니다.
서로 다른 소스의 데이터를 단일 시각화 또는 여러 시각화에 표시할 수 있습니다. 여러 데이터 테이블은 한 데이터 테이블의 필터링이 다른 데이터 테이블의 값에 영향을 주도록 서로 연결될 수 있지만 완전히 별개로 유지될 수도 있으며 여기에 제한은 없습니다.
다음은 다양한 액세스 유형에 사용할 수 있는 다양한 로드 방법 및 기능에 대한 개요입니다. 자세한 내용은 로드 방법 항목을 참조하십시오.
| 도움이 되었습니까? | 커넥터 | TIBCO Data Virtualization | 인포메이션 서비스 |
|---|---|---|---|
| 데이터베이스 내 | 예 | 예 | – |
| 메모리 내 | 예 | 예 | 예 |
| 요청 시 | 예 | 예 | 예 |
| 사용자 지정 질의 | 예 | - | 예 |
Spotfire 분석은 여러 소스의 데이터를 단일 분석에 결합할 수 있는 완벽한 방법입니다. 예를 들어, 소형 메모리 내 데이터 테이블을 시작 지점으로 사용하여 요청 시에만 로드되는 외부 데이터베이스 내 데이터 테이블을 통해 자세한 정보를 가져올 수 있습니다. 여러 소스의 데이터를 개별적으로 또는 단일 시각화에 결합하여 볼 수 있습니다.
Spotfire를 사용하면 원하는 경우 데이터를 항상 최신 상태로 유지할 수 있습니다. 상황에 따라 단일 데이터 테이블, 데이터 테이블의 일부를 갱신하거나 전체 분석에서 모든 데이터를 다시 로드하도록 선택할 수 있습니다. 자세한 내용은 연결, 저장 및 포함된 데이터 항목을 참조하십시오.
- 대용량 데이터 작업
대용량 데이터로 작업할 경우 항상 특정 작업을 수행하는 데 시간이 오래 걸릴 수 있습니다. Spotfire를 사용하면 다른 대체 방법을 시도하려고 걱정할 필요가 없습니다. 시간이 오래 걸릴 경우 언제든지 작업을 취소할 수 있습니다. 계산을 마칠 때까지 기다리지 않으려면 작업을 취소하거나 다른 대체 방법으로 전환할 수 있습니다(예: 축에 대한 고유한 값이 더 적은 컬럼으로 전환). - 데이터베이스 내 데이터 작업
외부 데이터 소스의 데이터(데이터베이스 내 또는 db 내 데이터)로 작업할 때는 메모리 내의 데이터로 작업할 때와는 다른 여러 가지 차이점을 감안해야 합니다. 즉, 다른 방식으로 작동하거나 사용할 수 없는 기능도 있습니다. - 스트리밍 데이터 작업
실시간으로 업데이트를 추적하고 시각화하려는 경우 Spotfire에서 스트리밍 데이터에 연결할 수 있습니다. - 큐브 사용
Spotfire에서 큐브 데이터 작업 시 고려해야 할 몇 가지 사항이 있습니다. - 외부 데이터 행 제한 사용
Spotfire 관리자는 데이터베이스 내 데이터로 작업할 때 검색 및 시각화할 수 있는 행의 수에 대한 제한을 구성할 수 있습니다. 이 방법을 통해 네트워크, 데이터베이스 및 시스템 메모리에 부하를 줄 수 있는 대량 데이터의 로드를 방지할 수 있습니다. 이 제한은 리스트박스 필터, 계층 필터 및 항목 필터는 물론 시각화에도 영향을 미칩니다.