词汇函数


EXCEEDDATA支持这些词汇函数:

  • tx_filter_cn(exp [, min_character] [, exclude_number] [, exclude_common_words] [, custom_pattern]): 中文的文本词汇过滤函数。min_character为最小的字数量,默认值为2。exclude_number为是否排除数字,默认值为TRUE。exclude_common_words为是否排除常见字,默认值为TRUE。custom_pattern为定制的regex过滤模板。
  • tx_filter_en(exp [, min_character] [, exclude_number] [, exclude_common_words] [, custom_pattern]): 英文的文本词汇过滤函数。min_character为最小的字数量,默认值为2。exclude_number为是否排除数字,默认值为TRUE。exclude_common_words为是否排除常见字,默认值为TRUE。custom_pattern为定制的regex过滤模板。
  • tx_segment_cn(exp [,algo]): 中文的文本词汇切割,可选算法。默认algo算法为maxngram。 ** 'max': 正向最大匹配算法 ** 'min': 正向最小匹配算法 ** 'rmax': 逆向最大匹配算法 ** 'rmin': 逆向最小匹配算法 ** 'bmax': 双向最大匹配算法 ** 'bmin': 双向最小匹配算法 ** 'bmaxmin': 双向最大最小匹配算法 ** 'fullseg': 全切分算法 ** 'maxngram': 最大ngram算法
  • tx_segment_en(exp): 英文的文本词汇切割函数。
  • tx_tag_cn(exp [,algo]): 中文的文本词性切割,可选算法。默认algo算法为maxngram。