DBScan


DBScan()操作对输入的数据集用DBSCan算法计算距离密度聚类。

  • keys: (必需提供) STRING格式。标识KEY对象的表达式,多列以逗号分隔。
  • x: (必需提供) STRING格式。X变量的表达式。
  • y: (必需提供) STRING格式。Y变量的表达式。
  • epsilon: (非必需) DOUBLE格式。点之间距离范围的最大值。 默认值为100。如果coordinates是TRUE,这个值的单位是米。
  • min_points: (非必需) INT格式。 最低聚类内的点数量。 默认值为10。
  • coordinates: (非必需) BOOLEAN格式。 是否x-y点为(longitude,latitude)坐标。 默认值为FALSE。
  • add_xy: (非必需) BOOLEAN格式。 是否新增加X和Y点的列。默认值为FALSE。
  • x_name (非必需) STRING格式。 X列名。默认值为'x',如果coordinates是TRUE,默认值为'longitude'。
  • y_name (非必需) STRING格式。 X列名。默认值为'x',如果coordinates是TRUE,默认值为'latitude'。
  • cluster_name (非必需) STRING格式。 新增加的预测聚类的列名。默认值为'cluster'。