데이터 모델링 및 정리

Spotfire에서는 여러 가지 방법으로 데이터를 클렌징, 수정 및 개선할 수 있습니다.

주: 여기에 설명된 일부 기능은 설치된 Spotfire 클라이언트를 통해서만 작성하거나 액세스할 수 있습니다.

데이터베이스 모델 재사용

데이터베이스에서 모델을 구축하고 관계를 설정하는 데 많은 시간을 소모하고 있다면 Spotfire에서는 이 작업을 자연스럽게 이용할 수 있습니다. 데이터베이스에 정의된 모든 관계와 제약 조건은 데이터 연결 또는 인포메이션 링크 구성에서 살펴볼 보기를 정의할 때 사용할 수 있습니다.

데이터 연결, 인포메이션 링크 및 해당 요소뿐만 아니라 분석 파일을 라이브러리에 저장하고 재사용할 수 있으므로 새 분석을 생성하기 위한 시작 시간을 최소화할 수 있습니다.

데이터 랭글링

확장된 분석 내 데이터 플라이아웃에서는 컬럼의 데이터 서식 지정, 서식 지정 및 범주화와 같은 사항을 직접 변경할 수 있습니다. 또한 컬럼 유형에 따라 한 컬럼을 여러 컬럼으로 분할하거나 비어 있는 값을 한 값으로 바꾸는 옵션이 있을 수 있습니다. 일부 유형의 클렌징이 단일 클릭을 사용하여 적용되는 권장으로 표시될 수도 있습니다.

사용자 지정 표현식 및 계산된 컬럼

사용자 지정 표현식을 사용하면 데이터 테이블의 컬럼 및 사용 가능한 표현식 함수를 기반으로 시각화에 대해 자신만의 집계 방법을 만들 수 있습니다. 메모리 내 데이터 테이블은 Spotfire 표현식 언어의 모든 함수를 항상 사용할 수 있는 반면 데이터베이스 내 데이터 테이블의 경우에는 현재 커넥터가 제공하는 함수만 사용할 수 있습니다. 하지만 기존의 강력한 사용자 지정 표현식은 THEN 키워드를 사용하여 이미 집계된 데이터에 대해 계산될 표현식의 일부를 추가함으로써 더욱 효과적으로 사용할 수 있습니다. 이렇게 하면 데이터를 원하는 대로 모델링하고 무한한 계산을 수행할 수 있습니다.

사용자 지정 표현식은 표현식에 대한 포함된 컬럼의 현재 필터링된 값에 따라 계산됩니다. 사용자 지정 표현식은 사용되는 축에만 영향을 줍니다.

계산된 컬럼은 포함된 컬럼의 모든 값을 사용하며 계산 결과가 포함된 새 컬럼이 데이터 테이블에 추가된다는 점을 제외하고는 사용자 지정 표현식과 거의 비슷합니다.

변환 및 데이터 함수

Spotfire에서 분석하려는 데이터가 가장 적합한 형식이 아니거나 심지어 오류가 포함되어 있는 경우도 있습니다. 따라서 분석에서 최상의 결과를 얻으려면 데이터에 변환을 수행하는 것이 유용할 수 있습니다. 몇 가지 방법으로 데이터를 변환할 수 있습니다. 예를 들어 컬럼을 계산하고 바꾸고, 컬럼 이름이나 데이터 형식을 변경하고, 데이터 함수를 사용하여 미리 정의되어 있는 통계 계산을 수행하고, 데이터를 정규화하거나 피벗/언피벗할 수 있습니다.

데이터를 로드할 때 또는 나중에(데이터를 Spotfire에 이미 로드한 경우) 변환을 적용할 수 있습니다. 분석에서 선택하는 항목에 따라 내용이 변경되는 특정 컬럼 유형을 제외하고 Spotfire로 로드되는 대부분의 "일반" 컬럼 유형에 대해 변환을 수행할 수 있습니다.

주: 데이터베이스 내 데이터에는 변환이 적용되지 않습니다. 하지만 연결에서 데이터를 가져오도록 선택하는 경우에는 다른 많은 데이터 소스처럼 변환을 사용할 수 있습니다.

데이터 함수에서 Spotfire® Enterprise Runtime for R(a/k/a TERR™), R 또는 Python의 통계 성능을 활용하면 원하는 변환을 만들 수 있는 무한한 잠재력을 얻을 수 있습니다.

통계 도구

설치된 클라이언트에서는 데이터 상관성 분석, K-평균 군집분석, 라인 유사성, 계층적 군집분석, 회귀 모델링 및 분류 모델링에 Spotfire 도구를 사용할 수 있습니다.