Spotfire® 사용 설명서

데이터 함수 등록

R 또는 다른 언어로 작성된 계산을 분석에 추가함으로써 데이터 함수를 사용하여 Spotfire의 기능을 향상시킬 수 있습니다. 데이터 함수는 Spotfire® Enterprise Runtime for R(TERR™이라고도 함) 엔진, 오픈 소스 R 엔진 또는 Python 인터프리터와 같은 통계 엔진을 사용하여 실행됩니다. 함수를 등록하고 라이브러리에 저장하면 모든 분석에서 사용할 수 있으며 스크립트 작성자가 아닌 다른 사용자도 사용할 수 있습니다.

이 태스크 정보

또한 데이터 함수 소개는 데이터 함수란?데이터 함수 작성 항목을 참조하십시오.
이 예제에서는 TERR 데이터 함수를 등록하는 방법을 소개하며, 다른 계산 엔진을 사용하여 데이터 함수를 등록할 때도 동일한 절차를 사용합니다.
팁: 데이터 캔버스(fx 노드에서 접근 가능)의 스크립트 편집 대화 상자 또는 데이터 함수 속성을 사용하여, 설치된 클라이언트를 통해 이전에 추가한 데이터 함수 스크립트를 편집할 수 있습니다.

시작하기 전에

여기에 설명된 기능은 설치된 클라이언트를 사용하여 작성되어야 합니다.

프로시저

  1. 설치된 Spotfire 클라이언트의 메뉴 표시줄에서 도구 > 데이터 함수 등록을 선택합니다.
  2. 이름 필드에 함수의 이름을 입력합니다.
    패키지를 사용하려는 경우 이름이 패키지에 사용된 이름과 정확히 동일하지 않으면 Spotfire가 함수를 찾을 수 없다는 점을 기억하십시오. 패키지에 대한 자세한 내용은 해당 서비스에 대한 설명서를 참조하십시오.
  3. 유형 드롭다운 목록에서 사용할 스크립트의 유형을 선택합니다(예: R 스크립트 - Spotfire Enterprise Runtime for R).

    액세스할 수 있는 옵션은 관리자가 Spotfire 환경에서 사용할 수 있도록 설정한 항목 또는 로컬에 설치한 도구에 따라 다릅니다.

    미리 정의된 R 함수의 경우 오픈 소스 R 함수를 선택합니다. Spotfire에서 사용할 함수를 정의하고 저장한 경우, 해당 이름을 모든 필요한 입력 및 출력 매개변수 이름과 함께 기록해 두거나 기억해 두어야 합니다.

    새 스크립트를 정의하려면 R 스크립트 - 오픈 소스 R, R 스크립트 - Spotfire Enterprise Runtime for R 또는 Python 스크립트를 선택합니다. (회사에서 다른 옵션을 사용할 수도 있습니다.)

  4. 옵션: 통계 패키지의 미리 정의된 함수를 포함하려면 패키지 필드에서 함수가 있는 패키지의 정확한 이름을 입력합니다.
    패키지 필드를 사용하면 다운로드한 패키지를 사용하여 미리 정의된 통계 R 또는 TERR 함수에 기반하여 데이터 함수를 만들 수 있습니다. 여기서 현재 데이터 함수에서 사용할 패키지를 세미콜론으로 구분하여 지정할 수 있습니다. 패키지에 대한 자세한 내용은 해당 서비스에 대한 설명서를 참조하십시오.

    예를 들어 미리 정의된 통계 R 함수를 기반으로 하는 데이터 함수를 만들려면 패키지 이름을 제공하고, 필요한 경우 CRAN에서 다운로드합니다. 함수가 위치한 패키지의 정확한 이름을 입력합니다. 이는 리포지토리에 동일한 이름을 가진 함수가 여러 개 있거나 패키지가 자동으로 로드되지 않는 경우에만 필요합니다.

    로컬 Python 스크립트의 경우 이 필드를 사용하면 데이터 함수를 실행하는 데 필요한 시간을 줄이기 위해 미리 로드할 수 있는 Python 패키지를 나열할 수 있습니다. 이 필드는 핫 스페어 사용이 활성화된 경우 설치된 클라이언트에서 사용됩니다. 웹 클라이언트에서 실행되는 원격 서비스 또는 데이터 함수에는 영향을 미치지 않습니다. 확실하지 않으면 필드를 비워 두십시오. 여기서 패키지를 지정하고 스크립트에서 패키지를 가져와야 합니다.

    패키지가 여러 개 필요한 경우 패키지 이름을 세미콜론으로 구분합니다.

  5. 통계 패키지의 미리 정의된 함수에 기반한 데이터 함수를 등록할 때는 함수 이름 필드에 원하는 함수의 이름을 패키지에 정의되어 있는 대로 정확하게 입력합니다.
    이 단계는 스크립트 기반 데이터 함수에는 적용되지 않습니다.
  6. 함수의 설명을 제공하여 다른 사용자가 더 쉽게 찾고 사용할 수 있도록 합니다.
  7. 데이터 함수가 스크립트를 기반으로 해야 하는 경우, 스크립트를 스크립트 탭에 입력하거나 붙여 넣거나 가져옵니다.
  8. 입력 매개변수 탭에서 필요한 입력 매개변수를 모두 추가합니다.
    입력 매개변수를 정의하는 방법은 데이터 함수를 실행할 때 정의됩니다.
  9. 필요한 경우 목록의 순서가 입력 매개변수를 불러올 순서를 반영하도록 입력 매개변수를 이동합니다.
  10. 출력 매개변수 탭에서 필요한 출력 매개변수를 모두 추가합니다.
    출력 매개변수를 정의하는 방법은 데이터 함수를 실행할 때 정의됩니다.
  11. 옵션: 데이터 함수가 수행하는 작업을 설명하는 아이콘을 선택합니다.
    적합한 범주를 선택하면 최종 사용자가 라이브러리에서 올바른 데이터 함수를 더 쉽게 찾을 수 있습니다. 아이콘은 데이터 함수가 표시되는 다양한 인터페이스에 표시됩니다(예: 파일 및 데이터 플라이아웃, f(x) 플라이아웃, 데이터 캔버스). 미리 정의된 여러 범주 아이콘 중에서 선택하거나 사용자 지정 SVG(Scalable Vector Graphics) 아이콘을 사용할 수 있습니다. Spotfire 환경에서 작동하는 사용자 지정 아이콘 생성에 대한 자세한 내용은 GitHub의 시각화 모드용 아이콘 만들기를 참조하십시오.
  12. 데이터 함수를 라이브러리에 저장합니다.
    이후 단계에서 라이브러리에서 함수를 쉽게 찾을 수 있도록 저장할 때 키워드를 지정할 수 있습니다. 기본 아이콘이 아닌 다른 아이콘을 선택하면 아이콘 범주가 자동으로 키워드로 추가됩니다.
  13. 닫기를 클릭합니다.

결과

이제 데이터 함수를 파일 및 데이터 또는 f(x) 플라이아웃(모든 클라이언트에서), 데이터 함수 속성 > 삽입(설치된 클라이언트만 해당)에서 실행하거나 설치된 클라이언트를 사용하여 변환으로 추가하여 분석에 추가할 수 있습니다(자세한 내용은 라이브러리에서 데이터 함수 실행 또는 데이터 변환 참조).

데이터 함수 등록 대화 상자

데이터 함수 등록 대화 상자에서는 완전히 새로운 데이터 함수를 등록할 수 있을 뿐만 아니라, 추가 구성을 위해 라이브러리에서 이전에 저장된 데이터 함수를 열고, 이전에 디스크로 내보낸 스크립트 함수 정의(*.sfd) 또는 다른 스크립트 편집 도구를 사용하여 만든 Python 스크립트 파일(*.py) 또는 R 스크립트 파일(*.r)을 가져오고, 다른 스크립트 편집 환경에서 공유하거나 추가로 편집할 수 있도록 스크립트 함수 정의를 디스크에 내보낼 수 있습니다.
주: 데이터 함수 등록 대화 상자를 사용하여 Statistica 데이터 함수를 만들 수 없습니다. 이러한 유형의 데이터 함수를 사용하는 방법에 대한 자세한 내용은 Statistica와 Spotfire 통합을 참조하십시오.


실행을 클릭하면 입력 및 출력 매개변수에 대한 설정을 지정하고 현재 데이터 함수를 실행할 수 있습니다. 일반적으로 데이터 함수를 라이브러리에 저장하기 전에 테스트하기 위한 바로 가기 역할을 합니다. 불필요한 인스턴스가 분석에 저장되지 않도록 하려면 테스트 중에 추가된 내장된 인스턴스를 분석에서 제거해야 합니다.

나중에 데이터 함수를 라이브러리의 모든 업데이트와 동기화할 수 있도록, 분석을 저장하기 전에 f(x) - 분석 도구 또는 파일 및 데이터에서 또는 데이터 함수 속성(설치된 클라이언트만 해당)에서 삽입을 사용하여 저장된 데이터 함수를 실행합니다.

캐싱 허용은 이전에 계산한 동일한 입력 값 하위 집합이 있는 경우 해당 계산을 재사용하도록 지정합니다. 입력 데이터의 일부를 현재 분석과 다른 위치에서 가져오고 입력 데이터가 변경될 때마다 새로 계산하려면 이 체크박스를 선택 취소합니다. 이는 이전에 이미 계산된 입력 데이터를 변경할 때에도 마찬가지입니다. 입력이 필터링된 값, 마크된 값 또는 속성 값에 종속되는 경우 입력 데이터가 변경될 수 있습니다.

예를 들어 데이터 함수에 난수 생성자가 포함되어 있는 경우 이전에 생성된 난수를 캐시하지 않고 대신 데이터 함수를 갱신할 때마다 새 난수를 계산하려는 경우입니다. 데이터 함수에 현재 날짜 또는 시간이 포함되어 있는 경우에도 이 체크박스를 선택 취소합니다.

스크립트 탭에서 지정한 스크립트 유형 언어로 스크립트를 입력하거나 붙여 넣을 수 있습니다. 가져온 스크립트를 편집할 수도 있습니다. 도구 > 옵션 > 글꼴을 사용하고 표현식 및 스크립트 편집기를 선택하여 스크립트 탭의 글꼴 설정을 변경할 수 있습니다. 스크립트 편집기에서는 구문 강조 표시 및 자동 들여쓰기 기능을 통해 스크립트를 쉽게 읽고 쓸 수 있습니다.

입력 매개변수 탭에서는 스크립트에 사용되는 모든 입력 매개변수를 나열하고 정의합니다. 이 목록에 있는 입력 매개변수의 순서에 따라 입력 매개변수를 불러오는 순서가 결정됩니다.

  • 입력 매개변수 이름 또는 이름은 함수 또는 스크립트에서 참조된 매개변수의 이름입니다.
  • 표시 이름은 최종 사용자에게 표시할 매개변수의 이름입니다.
  • 유형, 컬럼 또는 테이블(데이터 테이블)일 수 있는 입력 유형을 결정합니다. 입력 매개변수가 하나 이상의 컬럼인지 단일 값인지 여부를 정의합니다.
  • 허용된 데이터 유형은 이 입력 매개변수에서 지원되는 데이터 형식을 지정합니다. 입력 매개변수를 정의할 때 허용하려는 모든 데이터 유형을 선택할 수 있습니다. 각 입력 매개변수에 대해 하나 이상의 데이터 유형을 선택해야 합니다.
  • 설명에는 최종 사용자가 제공해야 하는 내용을 이해하는 데 도움이 되도록 입력 매개변수에 대한 자세한 정보를 선택적으로 포함할 수 있습니다.
  • 필수 매개변수는 함수를 호출할 때 매개변수가 필요함을 명시합니다. 매개변수가 필요하지 않은 경우 함수는 매개변수 없이도 작동할 수 있어야 합니다.
출력 매개변수 탭에서는 스크립트에 사용되는 모든 출력 매개변수를 나열하고 정의합니다.

  • 결과 매개변수 이름 또는 이름은 함수 또는 스크립트에서 참조된 매개변수의 이름입니다.
  • 표시 이름은 최종 사용자에게 표시할 매개변수의 이름입니다.
  • 유형, 컬럼 또는 테이블(데이터 테이블)일 수 있는 출력 유형을 결정합니다. 출력 매개변수가 하나 이상의 컬럼인지 단일 값인지 여부를 정의합니다.
  • 설명에는 최종 사용자가 얻을 내용을 이해하는 데 도움이 되도록 출력 매개변수에 대한 자세한 정보를 선택적으로 포함할 수 있습니다.
팁: 간단한 계산을 추가하려면 통계 함수에서 사용 가능한 TERR_* 함수를 사용하여 표현식 언어로 직접 TERR 스크립트를 추가하는 표현식 함수를 생성할 수 있습니다. 그런 다음 계산된 컬럼 및 사용자 지정 표현식의 표현식 언어에서 다른 함수처럼 사용할 수 있습니다. 그러나 표현식 함수는 다른 분석 간에 공유할 수 없습니다.