规范化列
有多种规范化方法可以编写为表达式,或在转换数据时使用。有关每种方法背后理论的说明,请参见本主题结尾的链接。
注: 此处介绍的某些功能只能使用已安装的 Spotfire 客户端进行创建或访问。
在以下表达式示例中,可以使用下列值:
列:E 和 A,其中 E 为要规范化的列,A 为基线列。
百分位数值:P
按平均值进行规范
[E]/Avg([E])
[E]*Avg([A])/Avg([E])
按截尾平均值进行规范
[E]/TrimmedMean([E], P)
[E]*TrimmedMean([A], P)/TrimmedMean([E], P)
按百分位数进行规范
[E] / Percentile([E], P)
[E] * Percentile([A], P) / Percentile([E], P)
0 到 1 之间的刻度
If(Max([E])= Min([E]), 0.5, ([E]-Min([E]))/(Max([E])-Min([E])))
减去平均值
[E]-Avg([E])
减去中位数
[E]-Median([E])
按带符号的比值进行规范
If([E]>[A], [E]/[A], -[A]/[E])
按对数比值进行规范
Log10([E]/[A])
按标准偏差单位中的对数比值进行规范
Log10([E]/[A])/StdDev(Log10([E]/[A]))
Z 得分计算
([E]-Avg([E]))/StdDev([E])
按标准偏差进行规范
[E]/StdDev([E])
- 按平均值进行规范
假设数据中有包含七个变量(A、B、C、D、E、F 和 G)(列)的 n 行。我们使用变量 E 作为以下计算中的示例。行中的其余变量按相同方式进行规范。 - 按剪裁平均值进行规范
变量的剪裁平均值基于除该变量的最低和最高值的某一百分比之外的所有值。这可以消除规范化期间离群值的影响。如果剪裁值设置为 10%,则最高 5% 和最低 5% 的值将被从计算的平均值中排除。 - 按百分比进行规范
假设数据中有包含七个变量(A、B、C、D、E、F 和 G)的 n 行。我们使用变量 E 作为以下计算中的示例。行中的其余变量按相同方式进行规范。 - 按介于 0 和 1 之间的刻度进行规范
假设数据中有包含七个变量(A、B、C、D、E、F 和 G)的 n 行。我们使用变量 E 作为以下计算中的示例。行中的其余变量按相同方式进行规范。 - 通过减去平均值进行规范
假设数据中有包含七个变量(A、B、C、D、E、F 和 G)的 n 行。我们使用变量 E 作为以下计算中的示例。行中的其余变量按相同方式进行规范。 - 通过减去中值进行规范
假设数据中有包含七个变量(A、B、C、D、E、F 和 G)的 n 行。我们使用变量 E 作为以下计算中的示例。行中的其余变量按相同方式进行规范。 - 按带符号的比值进行规范
假设数据中有包含七个变量(A、B、C、D、E、F 和 G)的 n 行。我们使用变量 E 作为以下计算中的示例。所有目标变量按相同方式进行规范。 - 按对数比值进行规范
假设数据中有包含七个变量(A、B、C、D、E、F 和 G)的 n 行。我们使用变量 E 作为以下计算中的示例。所有目标变量按相同方式进行规范。 - 按标准偏差单位中的对数比值进行规范
假设数据中有包含 k 个变量(A、B、C、D、E、F 和 G)的 n 行。我们使用变量 E 作为以下计算中的示例。所有目标变量按相同方式进行规范。 - 按 Z 得分进行规范
假设有五行,ID 分别为 A、B、C、D 和 E,每行包含 n 个不同的变量(列)。我们使用记录 E 作为以下计算中的示例。其余行按相同方式进行规范。 - 按标准偏差进行规范
假设有五行,ID 分别为 A、B、C、D 和 E,每行包含 n 个不同的变量(列)。我们使用记录 E 作为以下计算中的示例。其余行按相同方式进行规范。
父主题: 规范化