FPGrowth


FPGrowth()操作对输入的交易细节数据集做算法训练,并以最经常共同出现的商品组合进行推荐。

  • keys: (必需提供) STRING格式。标识KEY对象的表达式,多列以逗号分隔。这个值通常为交易事务的识别ID.
  • item: (必需提供) STRING格式。标识记录商品的表达式。
  • mode: (非必需) STRING格式。执行模式,支持值为train(训练模型)、predict(预测)、measure(衡量模型),默认值为train。
  • support: (非必需) DOUBLE格式。最低出现的比例,支持值为0.0-1.0之间。默认值为0.3。
  • association: (非必需) INT格式。最低同时出现的个数,支持的个数值为1+。默认值为2。
  • confidence: (非必需) DOUBLE格式。最低推荐的信心,支持值为0.0-1.0之间。默认值为0.6。
  • training: (非必需) DOUBLE格式。 从原始数据集里划分训练数据的比例。 支持的比例在0.0(不包括)到1.0(包括)之间。 默认值为1.0(所有数据)。
  • testing: (非必需) DOUBLE格式。 从原始数据集里划分测试数据的比例。 支持的比例在0.0(不包括)到1.0(包括)之间。 默认值为1.0(所有数据),但如果训练的比例不等于1.0的话,默认值为1.0减去训练的比例。
  • caching: (非必需) STRING格式。 中间结果的缓存机制。 默认值为 'memory'(内存)。