日日碰狠狠躁久久躁96avv-97久久超碰国产精品最新-婷婷丁香五月天在线播放,狠狠色噜噜色狠狠狠综合久久 ,爱做久久久久久,高h喷水荡肉爽文np肉色学校

睿治

智能數據治理平臺

睿治作為國內功能最全的數據治理產品之一,入選IDC企業數據治理實施部署指南。同時,在IDC發布的《中國數據治理市場份額》報告中,連續四年蟬聯數據治理解決方案市場份額第一。

數倉建設:數據域和主題域是什么關系?

時間:2022-05-22來源:不落若殤舞瀏覽數:1353

主題域是針對數據集市提出的概念,數據集市是面向主題,從業務驅動進行分析場景的建設。數據域是阿里數據中臺 CDM 層建設中提出的,是數據驅動業務,是對數據的分類,更好的數據賦能業務。

為什么會有域的概念呢?

首先來看看數據倉庫的定義吧,數據倉庫是一個面向主題的、集成的、相對穩定的、反映歷史變化的數據集合,用于支持管理決策。

主題域已經體現出來了

主題域用于將數據集市按照分析視角進行劃分,通常是聯系較為緊密的數據主題的集合。可以根據業務的關注點,將這些數據主題劃分至不同的主題域。

當然,還有另外一種說法。

數據倉庫是面向主題(數據綜合、歸類并進行分析利用的抽象)的應用。數據倉庫模型設計除橫向的分層外,通常也需要根據業務情況進行縱向劃分數據域。數據域是聯系較為緊密的數據主題的集合,通常是根據業務類別、數據來源、數據用途等多個維度,對企業的業務數據進行的區域劃分,將同類型數據存放在一起,便于快速查找需要的內容。不同使用目的數據,分類標準不同。例如,電商行業通常分為交易域、會員域、商品域等。

數據域劃分原則:全局性、可理解性和數量適中。

主題域

主題域通常是 聯系較為緊密的數據 主題的集合。可以根據業務的關注點,將這些數據主題劃分到不同的主題域。主題域的確定必須由最終用戶和數據倉庫的設計人員共同完成。

主題域、主題、實體間關系

主題設計是對主題域進一步分解,細化的過程。主題域下面可以有多個主題,主題還可以劃分成更多的子主題,而實體則是不可劃分的最小單位。主題域、主題、實體的關系如下圖所示:

可以顯而易見的看出,主題域是一個更大的概念,主題是略次之,實體最小,這里的實體表示的是實體對象(對應企業中某一宏觀分析領域所涉及的分析對象)。

主題域劃分

主題域是對某個主題進行分析后確定的主題的邊界。分析主題域,確定要裝載到數據倉庫的主題是信息打包技術的第一步。而在進行數據倉庫設計時,一般是一次先建立一個主題或企業全部主題中的一部分,因此在大多數數據倉庫的設計過程中都有一個主題域的選擇過程。

確定主題邊界實際上需要進一步理解業務關系,因此在確定整個分析主題后,還需要對這些主題進行初步的細化才便于獲取每一個主題應該具有的邊界。對于四個主題及其在企業中的業務關系可以確定邊界。

主題的使用

由于數據倉庫的設計是一個螺旋發展的過程。在剛開始,沒有必要在數據倉庫的數據庫中體現所有的主題,選擇最重要的主題作為數據倉庫設計的試金石是很有必要的。因此使用主題首先是找到需要分析的主題域。

例如在 AdventureWorks DW 數據倉庫的概念模型設計中,在對需求進行分析后,認識到“商品”主題既是一個銷售型企業最基本的業務對象,又是進行決策分析的最主要領域,因而把“銷售分析”主題域定義為要首先建立的主題。通過“商品”主題的建立,經營者就可以對整個企業的經營狀況有較全面的了解。先實施“商品”主題可以盡快地滿足企業管理人員建立數據倉庫的最初要求,所以先選定“商品”主題進行實施。

通過將主題邊界的劃分應用到已經得到的關系模型上還能形成原始的概念模型。這一模型是把主題域的劃分和事務處理數據庫中的表結合起來的模型,例如在上面的例子中,商品主題可能涵蓋的關系表有商品表、供應關系表、購買關系表和倉儲關系表;倉庫主題可能涵蓋的關系表有倉庫關系表、倉庫表、倉庫管理關系表和管理員表。

數據域

數據域是指面向業務分析,將業務過程或者維度進行抽象的集合。為保障整個體系的生命力,數據域需要抽象提煉,并長期維護更新。

在劃分數據域時,既能涵蓋當前所有的業務需求,又能讓新業務在進入時可以被包含進已有的數據域或擴展新的數據域。數據域的劃分工作可以在業務調研之后進行,需要分析各個業務模塊中有哪些業務活動。

數據域是 CDM 層的頂層劃分,是對企業業務的抽象提煉,面向業務分析,包含當前所有業務需求,也便于未來擴展。

數據域的使用

數據域可以按照用戶企業的部門劃分,也可以按照業務過程或者業務板塊中的功能模塊進行劃分。例如在線教育公司可以劃分為如下數據域,數據域中每一部分都是實際業務過程經過歸納抽象之后得出的。

數據域和主題域到底有什么區別呢?

主題域是針對數據集市提出的概念,數據集市是面向主題,從業務驅動進行分析場景的建設。

數據域是阿里數據中臺 CDM 層建設中提出的,是數據驅動業務,是對數據的分類,更好的數據賦能業務。

總結

數據域是對數據的分類,主題域和業務域是對業務的分類。

主題域和數據域最終都是對數據的分類,只是一個是數據視角,一個是業務視角。

根本的目的是:統一規則,方便管理,容易理解,有利于開發效率,有利于快速服務業務場景就可以了。

(部分內容來源網絡,如有侵權請聯系刪除)
立即申請數據分析/數據治理產品免費試用 我要試用
customer

在線咨詢

在線咨詢

點擊進入在線咨詢