Cassandra Input Connector


链接库路径为'CassandraInputConnector'。 默认ID为'cassandrain'。 支持参数:

  • hosts: (必需提供) STRING格式。 集群的主机名或区域(以' - '表示),多主机名或区域以逗号分隔。如: node1, 10.5.3.2, node2 - node19, node20.acme.com - node99.acme.com, 10.5.3.3 - 10.5.3.99。
  • username: (必需提供) STRING格式。 连接的用户名。
  • password: (必需提供) STRING格式。 连接的密码。
  • keyspace: (必需提供) STRING格式。 key空间名。
  • table_name: (必需提供) STRING格式。 读入表名。
  • query: (必需提供) STRING格式。 查询语句。
  • input_method: (非必需) STRING格式。 读入数据的方法。支持的方法为'cql'。默认值为 'cql'。
  • port: (非必需) INT格式。 连接端口。 默认值为 9160。
  • split_size: (非必需) INT格式。 分区的最大数据行数。 默认值为64000。
  • page_rows: (非必需) INT格式。 每批读的最大数据行数。 默认值为1000。
  • conditions: (非必需) STRING格式。 读入数据的过滤条件。
  • column_slice_range_start: (非必需) STRING格式。 列名过滤时,区域的开始值。
  • column_slice_range_end: (非必需) STRING格式。 列名过滤时,区域的结束值。
  • column_slice_range_reversed: (非必需) BOOLEAN格式。 是否反向列名过滤顺序。默认值为FALSE。
  • column_slice_range_limit: (非必需) INT格式。 最多过滤出来的列数量。默认值为MAX_VALUE。
  • key_range_start: (非必需) STRING格式。 key过滤时,区域的开始值。
  • key_range_end: (非必需) STRING格式。 key过滤时,区域的结束值。
  • partitioner_class: (非必需) STRING格式。 分区的class,默认值为'org.apache.cassandra.dht.Murmur3Partitioner'。
  • password_decrypt_class: (非必需) STRING格式。 解密密码的class名。