可免費試用30天
已有30000+人申請
全程“零”編碼,高效實現主數據模型、主數據維護、主數據分發、主數據質量的全過程管理,為企業主數據管理落地提供有效支撐,實現各業務系統間的主數據共享,保障企業主數據的唯一性、準確性、一致性。
覆蓋數據建模、采集、處理、集成、共享、交換、安全脫敏于一體,一站式解決數據開發所有的問題。
統一指標定義,實現“一變多變、一數多現”的數據管理效果,為企業提供強有力的數字化保障和驅動效應。
企業級智能體平臺,低門檻搭建智能體,靈活編排流程,融合 LLM 實現“問數”、“問知識”
面向企業級數據資產交易運營場景,助力企業實現數據資產的價值挖掘、升值和資產變現。
2022-11-11
湖倉一體指的是結合了數據倉庫和數據湖的元素而形成的數據解決方案。它實現了數據倉庫的數據結構和數據湖的可管理特性。通常既可以用來做機器學習,也可以用來做BI分析。湖倉一體的特點包括:
(1)統一的數據管理:湖倉一體提供完善的數據管理能力。數據湖中會存在兩類數據:原始數據和處理后的數據。數據湖中的數據會不斷地積累、演化,因此包含以下數據管理能力:數據源、數據連接、數據格式、數據schema(庫/表/列/行)。同時,數據湖是單個企業中統一的數據存放場所,因此,還具有一定的權限管理能力。
(2)多模態的存儲引擎:湖倉一體本身內置多模態的存儲引擎,以滿足不同的應用對于數據訪問需求(綜合考慮響應時間/并發/訪問頻次/成本等因素)。但是,在實際的使用過程中,為了達到可接受的性價比,湖倉一體解決方案提供可插拔式存儲框架,支持的類型有HDFS/S3等, 并且在必要時還可以與外置存儲引擎協同工作,滿足多樣化的應用需求。
(3)豐富的計算引擎:提供從批處理、流式計算、交互式分析到機器學習等各類計算引擎。一般情況下,數據的加載、轉換、處理會使用批處理計算引擎;需要實時計算的部分,會使用流式計算引擎;對于一些探索式的分析場景,可能又需要引入交互式分析引擎。隨著大數據技術與人工智能技術的結合越來越緊密,各類機器學習/深度學習算法也被不斷引入,可以支持從HDFS/S3上讀取樣本數據進行訓練。因此,湖倉一體解決方案提供計算引擎的可擴展/可插拔。
(4)數據全生命周期管理:湖倉一體提供一個企業中全量數據的存儲場所,需要對數據的全生命周期進行管理,包括數據的定義、接入、存儲、處理、分析、應用的全過程。一個強大的數據湖實現,需要能做到對其間的任意一條數據的接入、存儲、處理、消費過程是可追溯的,能夠清楚的重現數據完整的產生過程和流動過程。
現在申請試用億信華辰數據軟件,馬上可獲得:
領導駕駛艙、大屏分析等BI模板
多行業數字化轉型解決方案
海量工具及行業應用學習視頻