Pack


Pack()操作将输入数据集里每个主键下的所有记录行压成一个LIST列。它的常用场景是在做关联分析(例:FrequentPatternGrowth操作等)前将多条日志数据压成每个key一个LIST列的记录。

  • keys:(必需提供) STRING格式。 标识主键对象的表达式,多表达式以逗号分隔。
  • pack: (必需提供) STRING格式。行压成List的表达式,表达式里的值将转换成LIST。
  • sorts: (非必需) STRING格式。 标识数据序列里用以排序的表达式,多表达式以逗号分隔。
  • unique_only: (非必需) BOOLEAN格式。是否只包括不重复路径值。默认值为TRUE。
  • include_empty: (非必需) BOOLEAN格式。是否包括空路径值。默认值为FALSE。