分析操作


分析操作通过sparkjob.analytic.operations参数定义. 多个分析操作以 ';' 分隔. 我们通常用的是操作的短名。它们的全面路径是'com.exceeddata.ac.analytic.operation.'. 在下面的例子,在下面的例子,我们将c1的缓存读出,执行Stats()操作,然后用Result() 操作将结果通过 REST API返回. 注: Result()操作是一个特殊的操作,它将输入的数据集通过REST API返回.

分析操作支持属性定义,格式为 "classpath?attr1=val1,attr2=val2...". 目前支持:

  • input: (非必需) STRING格式. 输入的数据集id.
  • input2: (非必需) STRING格式. 输入的第二个数据集id.
  • output: (非必需) STRING格式. 输出的数据集id.

分析操作支持类似KEY= VALUE函数的参数 (…)。每个参数有名字,值被' `'包含而且多个以逗号 ','区分。

JSON

{ "sparkjob.access.operations": "Access?input=c1", "sparkjob.analytic.operations": "Stats(fields = *, analyze_metadata = true, analyze_string = true);Result()"

}