MongoDB Input Connector


链接库路径为'MongoDBInputConnector。默认ID为'mongodbin'。 支持参数:

  • uri: (必需提供) STRING格式。 连接的URI地址, 如mongodb://[user:password@]ip[:port]/database.collection[?...]。如果mongodb不是sharded,那么连接的用户需要有admin数据库的权限。
  • auth_uri: (非必需) STRING格式。 认证地址,如果连接的用户不在collection的数据库里。
  • query: (非必需) STRING格式。 过滤的查询语句。
  • input_method: (非必需) STRING格式。 读入数据的方法。支持的方法包括 'default'。 默认值为 'default'。
  • split_key_pattern: (非必需) STRING格式。 分割key的模式以便并行读入数据。
  • splitter_class: (非必需) STRING格式数据分割的实现对象,以便并行读入数据。
  • sort: (非必需) STRING格式。 数据排序的配置。
  • skip: (非必需) INT格式。 最多扫描的行数,超过不再读。 默认值为0 (无限制)。
  • limit: (非必需) INT格式。实际读入的最多行数限制。默认值为0 (无限制) 。
  • split_size: (非必需) INT格式。 分割数据的数量。默认值为8。
  • lazy_bson: (非必需) BOOLEAN格式。 是否用延迟BSON的实例。默认值为FALSE。
  • read_from_shard: (非必需) BOOLEAN格式。 是否从指定Shard读。默认值为FALSE。
  • read_from_secondary: (非必需) BOOLEAN格式。 是否从备份数据读(可能会有数据一致性问题)。默认值为FALSE。
  • split_on_chunk: (非必需) BOOLEAN格式。 是否以Chunk分割数据。默认值为TRUE。
  • no_timeout: (非必需) BOOLEAN格式。 是否无连接超时(无限等待)。默认值为FALSE。
  • key_fields: (非必需) STRING格式。读入key的列名,多列名以逗号分隔。默认key列名为 '_id'。
  • password_decrypt_class: (非必需) STRING格式。解密密码的class名。
  • include_key_in_dynamic_schema: (非必需) BOOLEAN格式。 是否在非结构化schema里带入key。默认值为FALSE。