CorrelationBy


CorrelationBy()操作计算输入数据集里每个主键下的两列数据的相关系数。

  • keys: (必需提供) STRING格式。 标识主键的表达式,多列以逗号分隔。
  • x: (必需提供), STRING格式。第一个计算相关系数的列的表达式。
  • y: (必需提供), STRING格式。第二个计算相关系数的列的表达式。
  • defaultx: (非必需) DOUBLE格式。第一列默认值的表达式(替换空值)。 默认值为 0。
  • defaulty: (非必需) DOUBLE格式。第二列默认值的表达式(替换空值)。 默认值为 0。
  • correlation_name: (非必需) STRING格式。新增加的关联系数的列名。默认值为'correlation'。