통계 함수

목록에는 표현식에 사용할 수 있는 통계 함수가 나와 있습니다.


함수	설명
`Avg(Arg1, ...)`	인수의 평균(산술 평균)을 반환합니다. 인수 및 결과는 실수 형식입니다. 인수를 한 개 지정한 경우 결과는 모든 행의 평균이 됩니다. 인수를 여러 개 지정한 경우 결과는 각 행의 평균이 됩니다. Null 인수는 무시되므로 평균값에 영향을 주지 않습니다. 예: `Avg([Column])` `Avg(2,-3,4)`→ 1 `Avg(-1)` → -1 `Avg(1.5, -2, 3.5)` → 1 `Avg(1, null, 3)` → 2 `Avg(null)` → `(Empty)`
`ChiDist(Arg1)`	인수의 (위 꼬리) 카이제곱 p 값을 반환합니다. 예: `ChiDist(x, deg_freedom)` `ChiDist(7.377759, 2)` → 0.025
`ChiInv(Arg1)`	인수의 (위 꼬리) 카이제곱 변위치 값을 반환합니다. 예: `ChiInv(p, deg_freedom)` `ChiInv(0.025, 2)` → 7.377759
`Count(Arg1)`	인수 컬럼에서 비어 있지 않은 값 수를 계산합니다. 인수를 지정하지 않은 경우 행의 총 수를 계산합니다. 예: `Count([Column])`
`CountBig(Arg1)`	인수 컬럼에서 비어 있지 않은 값 수를 계산합니다. 인수를 지정하지 않은 경우 행의 총 수를 계산합니다. 이 함수는 LongInteger를 반환합니다. 예: `CountBig([Column])`
`Covariance(Arg1, Arg2)`	인수로 지정된 두 컬럼의 공분산을 계산합니다. 예: `Covariance([Column1], [Column2])`
`FDist(Arg1)`	인수의 위 꼬리 F p 값을 반환합니다. 예: `FDist(x, deg_freedom1, deg_freedom2)` `FDist(6.936728, 1, 10)` → 0.025
`FInv(Arg1)`	인수의 위 꼬리 F 변위치 값을 반환합니다. 예: `FInv(p, deg_freedom1, deg_freedom2)` `FInv(0.025, 1, 10)` → 6.936728
`First(Arg1)`	인수 컬럼에서 데이터 행의 물리적 순서를 기반으로 첫 번째 유효 값을 반환합니다. 예: `First([Column])`
`GeometricMean()`	기하학적 평균 값을 계산합니다. 입력 값이 음수이면 결과는 "비어 있음"입니다. 입력 값이 0이면 결과는 0입니다. 예: `GeometricMean([Sales])`
`IQR(Arg1)`	값 차이 Q3-Q1 또는 75번째 백분위수 - 25번째 백분위수를 계산합니다. IQR을 H 분포라고도 합니다. 예: `IQR([Column])`
`L95(Arg1)`	95% 신뢰 구간의 하위 끝점을 계산합니다. 주: 이 함수에서 사용하는 고정 t-값 1.959964는 큰 샘플 크기(`n >= 40`)에 맞춰 조정된 것입니다. 샘플 크기가 이보다 작은 경우에는 다음 표현식을 대신 사용합니다. `Avg([Value])-TInv(0.025,Count()-1)*StdDev([Value])/Sqrt(Count())` 예: `L95([Column])`
`Lag(Arg1, Arg2)`	컬럼의 값을 지정된 단계 수만큼 아래로 전환합니다. 첫 번째 인수는 전환할 컬럼입니다. 두 번째(선택 항목) 인수는 단계 수입니다. 기본값은 1입니다. 음수의 단계 수를 사용하면 아래 이미지처럼 값이 반대 방향으로 전환됩니다. 예: `Lag([Column])` `Lag([Column],3)` Lag 함수는 데이터가 로드된 순서에 따라 데이터에 적용됩니다. 즉, 이 함수는 시각화의 정렬을 고려하지 않으며, 데이터의 변경(예: 다시 로드 도중)으로 여러 행의 값이 달라질 수 있습니다.
`Last(Arg1)`	인수 컬럼에서 데이터 행의 물리적 순서를 기반으로 마지막 유효 값을 반환합니다. 예: `Last([Column])`
`LastValueForMax(Arg1, Arg2)`	컬럼 1의 최대값에 대한 컬럼 2의 값을 반환합니다. 컬럼 1 최대값이 둘 이상인 경우 결과는 마지막 최대 행의 값이 됩니다. `ValueForMax`를 참조하십시오. 예: `LastValueForMax([Column 1], [Column 2])`
`LastValueForMin(Arg1, Arg2)`	컬럼 1의 최소값에 대한 컬럼 2의 값을 반환합니다. 컬럼 1 최소값이 둘 이상인 경우 결과는 마지막 최소 행의 값이 됩니다. `ValueForMin`을 참조하십시오. 예: `LastValueForMin([Column 1], [Column 2])`
`LAV(Arg1)`	인접한 하위 값을 계산합니다. 예: `LAV([Column])`
`Lead(Arg1, Arg2)`	컬럼의 값을 지정된 단계 수만큼 위로 전환합니다. 첫 번째 인수는 전환할 컬럼입니다. 두 번째(선택 항목) 인수는 단계 수입니다. 기본값은 1입니다. 음수의 단계 수를 사용하면 아래 이미지처럼 값이 반대 방향으로 전환됩니다. 예: `Lead([Column])` `Lead([Column],3)` Lead 함수는 데이터가 로드된 순서에 따라 데이터 적용됩니다. 즉, 함수는 시각화의 정렬을 고려하지 않으며, 데이터의 변경(예: 다시 로드 도중)으로 여러 행의 값이 달라질 수 있습니다.
`LIF(Arg1)`	하위 내부 펜스를 계산합니다. `Q1 – (1.5*IQR)`에 있는 임계값입니다. 예: `LIF([Column])`
`LOF(Arg1)`	하위 외부 펜스를 계산합니다. `Q1 – (3*IQR)`에 있는 임계값입니다. 예: `LOF([Column])`
`Max(Arg1, ...)`	최대값을 계산합니다. 인수를 한 개 지정한 경우 결과는 전체 컬럼의 최대값입니다. 인수를 여러 개 지정한 경우 결과는 각 행의 최대값이 됩니다. 인수 및 결과는 실수 형식입니다. Null 인수는 무시됩니다. 예: `Max([Column])` `Max(-1)` → -1 `Max (1.5, -2, 3)` → 3 `Max (1, null, 3)` → 3 `Max (null)` → `(Empty)`
`MeanDeviation(Arg1, ...)`	평균 편차 값(평균 절대 편차, AAD)을 계산합니다. 인수를 한 개 지정한 경우 결과는 모든 행의 평균 편차가 됩니다. 인수를 여러 개 지정한 경우 결과는 각 행의 평균 편차가 됩니다. 예: `MeanDeviation([Column])` `MeanDeviation(2,-3,4)` → 2.67
`Median(Arg1)`	인수의 중앙값을 계산합니다. 인수를 한 개 지정한 경우 결과는 모든 행의 중앙값이 됩니다. 인수를 여러 개 지정한 경우 결과는 각 행의 중앙값이 됩니다. 예: `Median([Column])` `Median(2,-3,4)`
`MedianAbsoluteDeviation(Arg1, ...)`	중앙값 절대 편차(MAD)를 계산합니다. 인수를 한 개 지정한 경우 결과는 모든 행의 중앙값 절대 편차가 됩니다. 인수를 여러 개 지정한 경우 결과는 각 행의 중앙값 절대 편차가 됩니다. 예: `MedianAbsoluteDeviation([Sales])` `MedianAbsoluteDeviation(2,-3,4)`
`Min(Arg1, ...)`	최소값을 계산합니다. 인수를 한 개 지정한 경우 결과는 전체 컬럼의 최소값입니다. 인수를 여러 개 지정한 경우 결과는 각 행의 최소값이 됩니다. 인수 및 결과는 실수 형식입니다. Null 인수는 무시됩니다. 예: `Min([Column])` `Min(-1)` → -1 `Min (1.5, -2, 3)` → -2 `Min (1, null, 3)` → 1 `Min (null)` → `(Empty)`
`NormDist(Arg1)`	인수의 (위 꼬리) 일반 p 값을 반환합니다. 이 값을 지정하지 않으면 결과는 평균=0, 표준 편차=1이 됩니다. 예: `NormDist(x, mean, standard_dev)` `NormDist(1.96)` → 0.025
`NormInv(Arg1)`	인수의 (위 꼬리) 일반 변위치 값을 반환합니다. 이 값을 지정하지 않으면 결과는 평균=0, 표준 편차=1이 됩니다. 예: `NormInv(p, mean, standard_dev)` `NormInv(0.025)` → 1.96
`NthLargest(Arg1, Arg2)`	n번째 가장 큰 값입니다. 첫 번째 인수는 분석할 컬럼이며 두 번째 인수는 n의 값입니다. n이 컬럼의 값 수보다 큰 경우 가장 작은 값이 반환됩니다. 예: `NthLargest([Column], 10)`
`NthSmallest(Arg1, Arg2)`	n번째 가장 작은 값입니다. 첫 번째 인수는 분석할 컬럼이며 두 번째 인수는 n의 값입니다. n이 컬럼의 값 수보다 큰 경우 가장 큰 값이 반환됩니다. 예: `NthSmallest([Column], 10)`
`Outliers(Arg1)`	외부 값 계산. 상위 인접한 값보다 크거나 하위 인접한 값보다 작은 값의 개수를 계산합니다. 예: `Outliers([Column])`
`P10(Arg1)`	10번째 백분위수는 데이터 값의 10%가 값보다 작거나 같은 값입니다. 예: `P10([Column])`
`P90(Arg1)`	90번째 백분위수는 데이터 값의 90%가 값보다 작거나 같은 값입니다. 예: `P90([Column])`
`PctOutliers(Arg1)`	외부 값 백분위수. 상위 인접한 값보다 크거나 하위 인접한 값보다 작은 값의 비율을 계산합니다. 예: `PctOutliers([Column])`
`Percent(Arg1, Arg2)`	백분율은 값 범위(최대값 - 최소값) 내에서 최소값을 초과하는 특정 비율을 계산한 값입니다. 첫 번째 인수는 분석할 컬럼이며 두 번째 인수는 백분율입니다. 예: `Percent([Column], 15.0)`
`Percentile(Arg1, Arg2)`	백분위수는 데이터 값의 특정 비율이 값보다 작거나 같은 값입니다. 첫 번째 인수는 분석할 컬럼이며 두 번째 인수는 백분율입니다. 예: `Percentile([Column], 15.0)`
`Q1(Arg1)`	첫 번째 사분위수를 계산합니다. 예: `Q1([Column])`
`Q3(Arg1)`	세 번째 사분위수를 계산합니다. 예: `Q3([Column])`
`Range(Arg1)`	컬럼에서 가장 큰 값과 가장 작은 값 사이의 범위입니다. 결과는 인수의 데이터 형식에 따라 실수 또는 시간대로 반환됩니다. 예: `Range([Column])`
`StdDev(Arg1)`	표준 편차를 계산합니다. 예: `StdDev([Column])`
`StdErr(Arg1)`	표준 오차를 계산합니다. 예: `StdErr([Column])`
`TDist(Arg1)`	인수의 (위 꼬리) t p 값을 반환합니다. 예: `TDist(x, deg_freedom)` `TDist(4.302653, 2)` → 0.025
`TERR_Binary`	Spotfire® Enterprise Runtime for R(TERR™이라고도 함)을 호출하여 함수 이름에 의해 입력과 같은 수의 행을 포함하는 지정된 데이터 형식의 출력을 반환합니다. 첫 번째 인수는 스크립트이며 그 다음의 인수는 스크립트에 대한 인수입니다. 반환되는 컬럼은 입력과 동일한 수의 행을 포함해야 합니다. 스크립트 이외의 인수가 하나 이상 필요합니다. 입력은 `input1`, `input2`... `inputN` 변수에 저장되며 출력은 `output` 변수에 저장되어야 합니다. 예: `TERR_Real("output <- input1*100 + input2", [Record No], [Sales])` `TERR_String("output <- input1", [String Column])`
`TERR_Boolean`	위의 TERR_Binary를 참조하십시오.
`TERR_DateTime`	위의 TERR_Binary를 참조하십시오.
`TERR_Integer`	위의 TERR_Binary를 참조하십시오.
`TERR_Real`	위의 TERR_Binary를 참조하십시오.
`TERR_String`	위의 TERR_Binary를 참조하십시오.
`TERRAggregation_Binary`	TERR 엔진을 호출하고 지정된 데이터 유형의 출력을 반환합니다. 첫 번째 인수는 스크립트이며 그 다음의 인수는 스크립트에 대한 인수입니다. 스크립트는 집계된 단일 값을 반환해야 합니다. 스크립트 이외의 인수가 하나 이상 필요합니다. 입력은 `input1`, `input2`... `inputN` 변수에 저장되며 출력은 `output` 변수에 저장되어야 합니다. 예: `TERRAggregation_Real("output <- median(input1) + median(input2)", [X], [Y])` `TERRAggregation_String("output <- input1[1]", [Customer Name])`
`TERRAggregation_Boolean`	위의 TERRAggregation_Binary를 참조하십시오.
`TERRAggregation_DateTime`	위의 TERRAggregation_Binary를 참조하십시오.
`TERRAggregation_Integer`	위의 TERRAggregation_Binary를 참조하십시오.
`TERRAggregation_Real`	위의 TERRAggregation_Binary를 참조하십시오.
`TERRAggregation_String`	위의 TERRAggregation_Binary를 참조하십시오.
`TInv(Arg1)`	인수의 (위 꼬리) t 변위치 값을 반환합니다. 예: `TInv(p, deg_freedom)` `TInv(0.025, 2)` → 4.302653
`TrimmedMean(Arg1, Arg2)`	잘라낸 평균값(잘라낸 평균)을 계산합니다. 첫 번째 인수는 분석할 컬럼이고 두 번째 인수는 계산에서 제외할 값의 수(%)입니다. 자르기 값을 10%로 설정한 경우 가장 큰 5%의 값과 가장 작은 5%의 값이 계산된 평균에서 제외됩니다. 예: `TrimmedMean([Sales], 10)`
`U95(Arg1)`	95% 신뢰 구간의 상위 끝점을 계산합니다. 주: 이 함수에서 사용하는 고정 t-값 1.959964는 큰 샘플 크기(`n >= 40`)에 맞춰 조정된 것입니다. 샘플 크기가 이보다 작은 경우에는 다음 표현식을 대신 사용합니다. `Avg([Value])+TInv(0.025,Count()-1)*StdDev([Value])/Sqrt(Count())` 예: `U95([Column])`
`UAV(Arg1)`	인접한 상위 값을 계산합니다. 예: `UAV([Column])`
`UIF(Arg1)`	상위 내부 펜스를 계산합니다. `Q3 + (1.5*IQR)`에 있는 임계값입니다. 예: `UIF([Column])`
`UniqueCount(Arg1)`	인수 컬럼에서 비어 있지 않은 고유한 값의 수를 계산합니다. 예: `UniqueCount([Column])`
`UOF(Arg1)`	상위 외부 펜스를 계산합니다. Q3 + (3*IQR)에 있는 임계값입니다. 예: `UOF([Column])`
`ValueForMax(Arg1, Arg2)`	컬럼 1의 최대값에 대한 컬럼 2의 값을 반환합니다. 컬럼 1 최대값이 둘 이상인 경우 결과는 첫 번째 최대 행의 값이 됩니다. `LastValueForMax`를 참조하십시오. 예: `ValueForMax([Column 1], [Column 2])`
`ValueForMin(Arg1, Arg2)`	컬럼 1의 최소값에 대한 컬럼 2의 값을 반환합니다. 컬럼 1 최소값이 둘 이상인 경우 결과는 첫 번째 최소 행의 값이 됩니다. `LastValueForMin`을 참조하십시오. 예: `ValueForMin([Column 1], [Column 2])`
`Var(Arg1)`	분산을 계산합니다. 예: `Var([Column])`
`WeightedAverage(Arg1, Arg2)`	두 컬럼의 가중 평균을 계산합니다. Arg1은 가중 컬럼이고 Arg2는 값 컬럼입니다. 예: `WeightedAverage([Column1],[Column2])`

팁: DISTINCT 키워드를 사용하면 고유한 값만 사용하여 결과를 반환할 수 있습니다. 예를 들어 Avg(DISTINCT[Column])는 지정된 컬럼에 있는 모든 값의 평균이 아니라 고유한 값의 평균을 반환합니다. UniqueCount([Column])는 Count(DISTINCT[Column])와 같습니다.

함수를 참조하십시오.