ALS


ALS()操作对输入的数据集做Alternate Least Squares算法训练,并计算个性化推荐的协同过滤推荐。

  • user: (必需提供) STRING格式。标识用户列的表达式。
  • item: (必需提供) STRING格式。标识商品列的表达式。
  • ratings: (必需提供) STRING格式标识评分列的表达式,多表达式以逗号分隔。
  • weights: (非必需) STRING格式。权重,多权重以逗号分隔,如为空则使用信心指数。
  • mode: (非必需) STRING格式。执行模式,支持的值为train(训练模型)、predict(预测)、measure(衡量模型),默认值为train。
  • for_type: (非必需) STRING格式为用户推荐商品,或为商品推荐用户。支持的推荐为'user'和'product'。默认值为 'user'。
  • amount: (非必需) INT格式。推荐的数量。 为用户推荐商品的默认值为 10个;为商品推荐用户的默认值为100个。
  • implicit: (非必需) BOOLEAN格式是否是隐形行为所代表的评分。 默认值为FALSE。
  • alpha: (非必需) DOUBLE格式。信心指数。默认值为1.0。
  • negative: (非必需) BOOLEAN格式。是否允许非负权重。 默认值为TRUE。
  • rank: (非必需) INT格式。因子排名数量。默认值为10。
  • iterations: (非必需) INT格式。迭代的次数。默认值为10。
  • lambda: (非必需) DOUBLE格式。过拟合因子。默认值为0.01。
  • seed: (非必需) LONG格式。生成随机数的种子。默认值为7523。
  • min_rating: (非必需) DOUBLE格式。推荐时要求过的最低评分值。默认值为空(无要求)。
  • allocation: (非必需) INT格式。推荐比例(min_rating不为空时的需要更多推荐)。默认值为3。
  • training: (非必需) DOUBLE格式。 从原始数据集里划分训练数据的比例。 支持的比例在0.0(不包括)到1.0(包括)之间。 默认值为1.0(所有数据)。
  • testing: (非必需) DOUBLE格式。 从原始数据集里划分测试数据的比例。 支持的比例在0.0(不包括)到1.0(包括)之间。 默认值为1.0(所有数据),但如果训练的比例不等于1.0的话,默认值为1.0减去训练的比例。
  • caching: (非必需) STRING格式。 中间结果的缓存机制。 默认值为 'memory'(内存)。
  • prediction_name: (非必需) STRING格式。 新增加的预测值的列名。 默认值为 'prediction'。