数据集成工具
文章目錄
- 數據集成工具
- 數據采集工具分類
- 離線采集(批量采集)
- 實時采集(增量采集)
- Flume
- Sqoop
- DataX
- Canal
數據集成工具
數據采集工具分類
離線采集(批量采集)
實時采集(增量采集)
Flume
??flume是一個分布式、可靠、和高可用的海量日志采集、聚合和傳輸的系統。
Sqoop
??Apache開源軟件,主要用于在HADOOP(Hive)與傳統的數據庫(mysql、postgresql…)間進行數據的傳遞。
DataX
??是阿里開源軟件異構數據源離線同步工具,致力于實現包括關系型數據庫(MySQL、Oracle等)、HDFS、Hive、ODPS、HBase、FTP等各種異構數據源之間穩定高效的數據同步功能。
Canal
??canal,譯意為水道/管道/溝渠,主要用途是基于 MySQL 數據庫增量日志解析,提供增量數據訂閱和消費。
-
canal的數據同步不是全量的,而是增量。基于binary log增量訂閱和消費,canal可以做:
- 數據庫鏡像
- 數據庫實時備份
- 索引構建和實時維護
- 業務cache(緩存)刷新
- 帶業務邏輯的增量數據處理
到底啦!
總結
- 上一篇: [css] border-radius
- 下一篇: [css] css中Scroll-be