Condense


Condense()操作对输入数据集将稀疏值填充至同列最近的上个非空值,并以间隔窗口降量写出。

  • inclusion: (必需提供) STRING格式。标识非重复窗口的表达式,每一行数据对现有窗口解析,如果结果为FALSE则开始一个新的窗口。
  • fields: (非必需) STRING格式。指定填充值的列名,多列以逗号分隔。默认值为空(全部列)。
  • validity: (非必需) STRING格式。检查窗口是否有效的Boolean表达式。TRUE为有效,默认值为空(所有窗口都有效)。
  • reclaims: (非必需) BOOLEAN格式。是否将上个有效窗口的末值带入下一个窗口的解析。默认值为FALSE。
  • endpoint: (非必需) BOOLEAN格式。是否将结束窗口的非合法值带入窗口计算。默认值为FALSE。
  • keys: (非必需) STRING格式。 标识KEY对象的表达式,多列以逗号分隔。
  • sorts: (非必需) STRING格式。标识数据序列里用以排序的表达式,多表达式以逗号分隔。
  • partitionized: (非必需) BOOLEAN格式。填充是否在每个分区内各自做。默认值为FALSE。
  • partitions: (非必需) INT格式。 分布式分区的数量(如果需要重新分布)。默认值为0(保持现有的数据分布)。