Repartition


Repartition()操作重新分布输入数据集的分区数量 。它和Coalesce()的区别是它可以选择任意分区数量,增或降,但是会有重新分布数据的计算成本;而Coalesce()只能降分区数量,从而避免所有数据的重新分布的计算成本。

  • partitions: (必需提供) INT格式。分布式分区的数量。