NestedJoin


NestedJoin()操作将输入的两个数据集联接在一起。它可以支持主键相等或者主键不相等的join,并且能够自动处理两个数据集大小不一样的优化。

  • expressions: (必需提供) STRING格式。表达式,多表达式以逗号分隔,重复列名以left.和right.区分。例: 'left.field_name as target1', 'right.field_name as target_2' 。
  • conditions: (必需提供) STRING格式。联接左右两侧的表达式。例: 'left.field1 = right.field1 AND left.field2 = right.field2'。
  • type: (非必需) STRING格式。联接的方法。支持的方法包括'inner', 'left', 'right', 和'full'。 默认值为 'inner'。
  • batch: (非必需) INT格式。每批分布处理的行数。这是个性能优化参数。 默认值为10000。