AFTSurvivalRegression


AFTSurvivalRegression()操作对输入的数据集做生存回归的加速失效时间算法训练, 并计算回归的预测结果。

  • outcome: (必需提供) STRING格式。 结果变量的表达式或列定义。
  • censor: (必需提供) STRING格式。检查器的表达式。解析的值必须为0或1。
  • mode: (非必需) STRING格式。执行模式,支持值为train(训练模型)、predict(预测)、measure(衡量模型),默认值为train。
  • features: (非必需) STRING格式。 特征变量的表达式或列定义,多列以逗号分隔。默认值为空值(所有为数字变量而且非结果变量的列)。
  • vectorized: (非必需) BOOLEAN格式。 是否特征变量已经预处理成Vector。当值为TRUE的时候,特征变量的表达式只接受vector数据类型。默认值为FALSE。
  • independents: (非必需) INT格式。 最独立维数。可在维度多时配置,默认值为0(所有维度,不选择最独立维度/降维)。
  • principals: (非必需) INT格式。 降至的维数,可在维度多时配置,默认值为0(所有维度,不降维)。
  • iterations: (非必需) INT格式。 迭代的次数。 默认值为10。
  • tolerance: (非必需) DOUBLE格式。可容忍的余差比。 默认值为0.000001。
  • probabilities: (非必需) DOUBLE格式。分位数的概率,多个以逗号分隔。 支持值从0.0到1.0。
  • fit_intercept: (非必需) BOOLEAN格式。是否存放截距。默认值为TRUE.
  • training: (非必需) DOUBLE格式。 从原始数据集里划分训练数据的比例。 支持的比例在0.0(不包括)到1.0(包括)之间。 默认值为1.0(所有数据)。
  • testing: (非必需) DOUBLE格式。 从原始数据集里划分测试数据的比例。 支持的比例在0.0(不包括)到1.0(包括)之间。 默认值为1.0(所有数据),但如果训练的比例不等于1.0的话,默认值为1.0减去训练的比例。
  • caching: (非必需) STRING格式。 中间结果的缓存机制。 默认值为 'memory'(内存)。
  • prediction_name: (非必需) STRING格式。 新增加的预测值的列名。 默认值为 'prediction'。
  • quantiles_name: (非必需) STRING格式。 新增加的分位数的列名。 默认值为 'quantiles'。