Spotfire® 用户指南

创建分类模型

利用分类模型工具,可使用 Spotfire Enterprise Runtime for R 引擎创建分类模型,而无需亲自编写任何脚本。

关于此任务

有关一般概述,请参见预测模型

开始之前

必须在已安装的客户端中创建分类模型。
注: 预测模型工具使用基于 Spotfire Enterprise Runtime for R(又名 TERR)的数据函数来执行计算。Spotfire 环境必须支持 TERR 数据函数才能使用这些工具。有关详细信息,请参见脚本和数据函数的使用

过程

  1. 在菜单栏上,选择 “工具” > “分类模型”
  2. 添加您希望在“分析模型”面板中引用的模型的“名称”
  3. 在模型上添加“注释”以描述应将此模型用于哪种类型的数据。
  4. 选择要使用的“模型方法”
    “逻辑回归”分类树方法“分类树”中选择。
  5. 选择计算模型所依据的“数据表”
  6. “常规”选项卡上,指定“反应列”

    反应列指定您尝试预测的内容。它通常应为一个不包含过多值的列。

    选定反应列会自动添加到“公式表达式”字段。
  7. 如果“模型方法”设置为“逻辑回归”,请指定“反应级别”

    复杂性参数用于控制分类树的大小和选择最佳树大小。通常,应当仅有几个可能的反应值可用(例如“true”和“false”,或者“缺席”和“出席”)。

    “插入预测的列”对话框可让您将模型预测值嵌入到数据中。例如,如果反应为五个不同的结果并且如果您已选择了“结果 1”作为反应级别,那么所有其他可能的结果都将一起分组到“非结果 1”组中。

  8. “预测器列”下,选择您认为对您尝试预测的值(选定的反应列)可能会有影响的一个或多个变量,为变量指定合适的转换(如果需要),然后单击“添加”。重复上述操作添加更多变量。
    列出选定数据表中可用作预测器列的所有列。
    选定转换方法应能反映出反应列和选定预测器列之间的预期关系。例如,如果反应列预期与其他列有线性关系,那么应使用 Linear: x 方法将此列添加为预测器列。如果两列之间的关系为对数,那么可以使用 Log: log(x) 方法添加预测器列。
    “公式表达式”字段将更新以显示反应列和选定预测器列之间的关系。
    提示: 如果您要创建更高级的表达式,也可以手动编辑公式表达式字段。单击“清除”以清除公式表达式字段。
  9. 或者,您可以在“选项”选项卡上为模型提供更多输入。逻辑回归模型和分类树模型都允许您“使用权重列”
    权重列用于通过按权重列中的数字倍增来增大或减小特定行中值的重要性。
    对于“逻辑回归”模型,您还可以定义以下参数:
    • 最大迭代次数 – 指定在回归计算中要使用的最大迭代次数。
    • 收敛判据 – 指定模型的收敛判据。
    对于“分类树”模型,您还可以定义以下参数:
    • 最小分割 – 指定节点中可进行拆分的观察值的最小数目。
    • 复杂性参数 – 用于控制分类树的大小和选择最佳树大小。如果向当前节点的分类树添加其他变量与复杂性参数的价值相比耗费更高的成本,则树的构建将会停止。仅当总体失拟随复杂性参数的某一因素降低时,树的构建才会继续。如果复杂性参数设置为零,那么树将构建至其最大深度,可能会非常大。
    • 最大深度 – 指定树中任何节点的最大深度。
    • 交叉验证组大小 – 指定交叉验证组大小。
  10. 完成配置后,单击“确定”

结果

系统将创建模型页面(请参见模型页面)并将模型添加到分析模型面板