HBase Input Connector


链接库路径为'HBaseInputConnector。默认ID为'hbasein'。 支持参数:

  • table_name: (必需提供) STRING格式。 读入表的表名。
  • input_method: (非必需) STRING格式。 读入数据的方法。支持的方法为'table'。默认值为'table'。
  • conf_path: (非必需) STRING格式。 配置文件的路径。
  • scanner_cache_size: (非必需) INT格式。 每批读入的最大数据行数。默认值为10000。
  • scanner_start_row: (非必需) LONG格式。 读入行数的开始值(过滤)。默认值为0。
  • scanner_stop_row: (非必需) LONG格式。 读入行数的结束值(过滤)。默认值为0。
  • filter_pass_all: (非必需) BOOLEAN格式。 是否需要全部过滤条件都满足。 默认值为FALSE (只需要满足一个条件)。
  • filter_column_prefixes: (非必需) STRING格式。 列名前缀过滤条件。
  • filter_column_regexes: (非必需) STRING格式。 列名模式比较过滤条件。
  • filter_column_values: (非必需) STRING格式。列值过滤条件,多列以逗号分隔。
  • key_fields: (非必需) STRING格式。 读入key的列名,多列名以逗号分隔。默认值为'key'。
  • include_family_as_key: (非必需) BOOLEAN格式。是否将缀族转化成行key的一部分。这是为了模型里缀族其实是有意义的设计。 默认值为FALSE。