遥不可及|DataForce组件技术及功能:数据批量和实时同步

DataForce是慧都自主研发、应用最灵活的大数据平台 。 能够帮助您随时找到您想要的数据 , 使数据得到安全、稳定和高效的管理与应用 。 DataForce是企业大数据解决方案的重要组成部分 , 除了提供完整的大数据功能组件 , 我们还提供组件自定义搭配 , 为企业选择满足方案需要的大数据功能组件 , 使您的大数据解决方案成本降到最低 , 从而高品质的解决您的大数据需求问题 。
遥不可及|DataForce组件技术及功能:数据批量和实时同步了解什么是DataForce , 请点击这里查看DataForce的基础介绍>>
本文主要跟大家介绍DataForce的数据批量同步工具和数据实时同步工具 。
数据批量同步工具批量同步工具主要用于在大数据集群、数据仓库与传统的数据库(mysql、postgresql...)间进行数据的传递 , 可以将一个关系型数据库(例如 :mySQL,Oracle等)中的数据导进到大数据存储系统中 , 也可以将集群上的数据导进到关系型数据库中 。 它可以高效、可控地利用资源 , 可以通过调整任务数来控制任务的并发度 。 另外它还可以配置数据库的访问时间等等 。 它可以自动的完成数据类型映射与转换 。 我们往往导入的数据是有类型的 , 它可以自动根据元数据模型来判断数据类型 , 把数据库中的类型转换到集群上或者数据仓库中对应类型 , 当然用户也可以自定义它们之间的映射关系 。 它支持多种数据库 , 比如 , Mysql、Oracle和PostgreSQL等等数据库 。 对于某些NoSQL数据库它也提供了连接器 。
DataForce数据批量同步工具的特性
批量同步工具具有如下特性:

  1. 操作简单 , 有固定的写入命令模式 。
  2. 它支持多种数据库 , 比如 , Mysql、Oracle和PostgreSQL等等数据库 。
  3. 支持文本文件、avro、SequenceFiles 。
  4. 它可以高效、可控地利用资源 , 可以通过调整任务数来控制任务的并发度 。 另外它还可以配置数据库的访问时间等等 。
  5. 它可以自动的完成数据类型映射与转换 。 我们往往导入的数据是有类型的 , 它可以自动根据数据库中的类型转换到分布式集群上的目标存储 , 当然用户也可以自定义它们之间的映射关系 。
  6. 也可以根据增量字段值执行增量同步 。
  7. 可以创建为一个作业 , 需要用到时调用执行 。
  8. 可以通过脚本设置定时任务 。
  9. 自身带有校验机制 , 保证数据完整性 。
  10. 可以根据任务和硬件情况指定并行度 。
  11. 可以指定的导入特定的列 。
  12. 可以导入自定义的简单的sql语句查询结果 , 不支持复杂的语句 。
  13. 可以从关系数据库导入到集群 , 也可以从集群导出到关系数据库 。
  14. 支持增量的批量导入 。
DataForce数据批量同步工具的功能