Datax 是阿里开源的用于异构数据源之间的同步工具,如 MySQL 到 HDFS,MongoDB 到 ElasticSearch 等等,反之亦然。由于其良好的设计,同步效率极高,在互联网公司大数据部门得到广泛使用。
然而在实际使用中,仍然有许多调优的地方,如果不懂其工作原理,就很难真正发挥其威力,本文凭借自己在跨大洋(杭州到美国西部)全量数据同步取得的成功经验,试图通过源码解析的方式 还原其设计原理,让大家能更好的驾驭 Datax。
通过本文,您将有如下几点收获:
本文适合对 Datax 有一定使用基础或者想更进一步理解其实现原理的人员。
绑定成功
预订达标,作者开始写作
审核未达标,本场 Chat 终止
审核达标,文章发布
审核未达标,本场 Chat 终止