1、apache atlas

Apache Atlas 是 Apache 基金會的孵化項目,是 Hadoop 生態圈的
數據治理和元數據框架。Atlas 是一套核心基礎治理服務的集合,有很好的伸縮性和可擴展性,能夠滿足企業對 Hadoop 生態系統的多樣性需求,并能和企業的數據生態系統集成。
它為 Hadoop 集群提供了包括數據分類、集中策略引擎、數據血緣、安全和生命周期管理在內的元數據治理核心能力。?
但 atlas 的缺點是:只能對 hadoop 的元數據進行管理(雖然也是連的 Mysql ),對傳統數據庫的支持力度非常小;同時血緣分析也只支持特定的數據庫。
2、wherehows
Wherehows 定位于元
數據倉庫,元
數據存儲于 mysql 中,它從不同的源系統中采集元數據,并進行標準化和建模,從而作為元數據倉庫完成血緣分析。由 linkedin 開源。支持 Docker 部署。
優勢:
支持元數據歷史版本及對比分析。
一站式的元
數據分析管理系統。
劣勢:
支持的源系統比較少
開源版本僅支持 Azkaban 調度任務的血緣分析。其他調度任務僅能獲得元數據信息,而沒有血緣信息。
血緣分析較粗,不支持列級血緣。如 HDFS 僅能顯示數據文件之間的血緣。
Web UI 僅提供查詢能力,相關配置需要調用 API 接口。
缺乏用戶、權限管理能力。

3、億信元數據管理平臺內置豐富的采集適配器,通過自動化的采集方式,幫助企業完成數據信息、服務信息與業務信息的采集,自動調取企業內部的元數據。同時,該平臺通過多種分析方式幫助企業分析數據流向,具體到字段級的數據解析,如血緣分析、影響分析、關聯度分析等,幫助企業獲取數據上下游、對象關聯對象等等關系,快速定位問題字段,幫助企業降低數據問題的定位難度。
建立元模型

元數據建模是對企業要管理的元數據進行結構化、模型化。元模型的構建要一般要參考公共倉庫元模型CWM,但也不能照搬CWM,否則構建的元模型太過臃腫,不夠靈活。億信元數據管理平臺中的元模型支持CWM規范的同時,提供了一套便捷的自定義管理接口功能,可完全自定義擴展,能夠滿足元數據管理快速實施的需要,可適應用戶在不同時期的不同管理需要。
(部分內容來源網絡,如有侵權請聯系刪除)