為什么會有域的概念呢?
首先來看看數(shù)據(jù)倉庫的定義吧,數(shù)據(jù)倉庫是一個面向主題的、集成的、相對穩(wěn)定的、反映歷史變化的數(shù)據(jù)集合,用于支持管理決策。
主題域已經(jīng)體現(xiàn)出來了
主題域用于將數(shù)據(jù)集市按照分析視角進行劃分,通常是聯(lián)系較為緊密的數(shù)據(jù)主題的集合。可以根據(jù)業(yè)務的關(guān)注點,將這些數(shù)據(jù)主題劃分至不同的主題域。
當然,還有另外一種說法。
數(shù)據(jù)倉庫是面向主題(數(shù)據(jù)綜合、歸類并進行分析利用的抽象)的應用。數(shù)據(jù)倉庫模型設(shè)計除橫向的分層外,通常也需要根據(jù)業(yè)務情況進行縱向劃分數(shù)據(jù)域。數(shù)據(jù)域是聯(lián)系較為緊密的數(shù)據(jù)主題的集合,通常是根據(jù)業(yè)務類別、數(shù)據(jù)來源、數(shù)據(jù)用途等多個維度,對企業(yè)的業(yè)務數(shù)據(jù)進行的區(qū)域劃分,將同類型數(shù)據(jù)存放在一起,便于快速查找需要的內(nèi)容。不同使用目的數(shù)據(jù),分類標準不同。例如,電商行業(yè)通常分為交易域、會員域、商品域等。
數(shù)據(jù)域劃分原則:全局性、可理解性和數(shù)量適中。
主題域
主題域通常是 聯(lián)系較為緊密的數(shù)據(jù) 主題的集合。可以根據(jù)業(yè)務的關(guān)注點,將這些數(shù)據(jù)主題劃分到不同的主題域。主題域的確定必須由最終用戶和數(shù)據(jù)倉庫的設(shè)計人員共同完成。
主題域、主題、實體間關(guān)系
主題設(shè)計是對主題域進一步分解,細化的過程。主題域下面可以有多個主題,主題還可以劃分成更多的子主題,而實體則是不可劃分的最小單位。主題域、主題、實體的關(guān)系如下圖所示:

可以顯而易見的看出,主題域是一個更大的概念,主題是略次之,實體最小,這里的實體表示的是實體對象(對應企業(yè)中某一宏觀分析領(lǐng)域所涉及的分析對象)。
主題域劃分
主題域是對某個主題進行分析后確定的主題的邊界。分析主題域,確定要裝載到數(shù)據(jù)倉庫的主題是信息打包技術(shù)的第一步。而在進行數(shù)據(jù)倉庫設(shè)計時,一般是一次先建立一個主題或企業(yè)全部主題中的一部分,因此在大多數(shù)數(shù)據(jù)倉庫的設(shè)計過程中都有一個主題域的選擇過程。
確定主題邊界實際上需要進一步理解業(yè)務關(guān)系,因此在確定整個分析主題后,還需要對這些主題進行初步的細化才便于獲取每一個主題應該具有的邊界。對于四個主題及其在企業(yè)中的業(yè)務關(guān)系可以確定邊界。

主題的使用
由于數(shù)據(jù)倉庫的設(shè)計是一個螺旋發(fā)展的過程。在剛開始,沒有必要在數(shù)據(jù)倉庫的數(shù)據(jù)庫中體現(xiàn)所有的主題,選擇最重要的主題作為數(shù)據(jù)倉庫設(shè)計的試金石是很有必要的。因此使用主題首先是找到需要分析的主題域。
例如在 AdventureWorks DW 數(shù)據(jù)倉庫的概念模型設(shè)計中,在對需求進行分析后,認識到“商品”主題既是一個銷售型企業(yè)最基本的業(yè)務對象,又是進行決策分析的最主要領(lǐng)域,因而把“銷售分析”主題域定義為要首先建立的主題。通過“商品”主題的建立,經(jīng)營者就可以對整個企業(yè)的經(jīng)營狀況有較全面的了解。先實施“商品”主題可以盡快地滿足企業(yè)管理人員建立數(shù)據(jù)倉庫的最初要求,所以先選定“商品”主題進行實施。
通過將主題邊界的劃分應用到已經(jīng)得到的關(guān)系模型上還能形成原始的概念模型。這一模型是把主題域的劃分和事務處理數(shù)據(jù)庫中的表結(jié)合起來的模型,例如在上面的例子中,商品主題可能涵蓋的關(guān)系表有商品表、供應關(guān)系表、購買關(guān)系表和倉儲關(guān)系表;倉庫主題可能涵蓋的關(guān)系表有倉庫關(guān)系表、倉庫表、倉庫管理關(guān)系表和管理員表。
數(shù)據(jù)域
數(shù)據(jù)域是指面向業(yè)務分析,將業(yè)務過程或者維度進行抽象的集合。為保障整個體系的生命力,數(shù)據(jù)域需要抽象提煉,并長期維護更新。
在劃分數(shù)據(jù)域時,既能涵蓋當前所有的業(yè)務需求,又能讓新業(yè)務在進入時可以被包含進已有的數(shù)據(jù)域或擴展新的數(shù)據(jù)域。數(shù)據(jù)域的劃分工作可以在業(yè)務調(diào)研之后進行,需要分析各個業(yè)務模塊中有哪些業(yè)務活動。
數(shù)據(jù)域是 CDM 層的頂層劃分,是對企業(yè)業(yè)務的抽象提煉,面向業(yè)務分析,包含當前所有業(yè)務需求,也便于未來擴展。
數(shù)據(jù)域的使用
數(shù)據(jù)域可以按照用戶企業(yè)的部門劃分,也可以按照業(yè)務過程或者業(yè)務板塊中的功能模塊進行劃分。例如在線教育公司可以劃分為如下數(shù)據(jù)域,數(shù)據(jù)域中每一部分都是實際業(yè)務過程經(jīng)過歸納抽象之后得出的。

數(shù)據(jù)域和主題域到底有什么區(qū)別呢?
主題域是針對數(shù)據(jù)集市提出的概念,數(shù)據(jù)集市是面向主題,從業(yè)務驅(qū)動進行分析場景的建設(shè)。
數(shù)據(jù)域是阿里數(shù)據(jù)中臺 CDM 層建設(shè)中提出的,是數(shù)據(jù)驅(qū)動業(yè)務,是對數(shù)據(jù)的分類,更好的數(shù)據(jù)賦能業(yè)務。
總結(jié)
數(shù)據(jù)域是對數(shù)據(jù)的分類,主題域和業(yè)務域是對業(yè)務的分類。
主題域和數(shù)據(jù)域最終都是對數(shù)據(jù)的分類,只是一個是數(shù)據(jù)視角,一個是業(yè)務視角。
根本的目的是:統(tǒng)一規(guī)則,方便管理,容易理解,有利于開發(fā)效率,有利于快速服務業(yè)務場景就可以了。
Tips
個人建議,在 DWD 層可以按照數(shù)據(jù)域進行分類,DWS 層可以按照主題域劃分,ADS 層可以按照分析主題域(業(yè)務場景)劃分。
數(shù)據(jù)域劃分幾點需要注意的地方
1.不重不漏,確保每個表都在一個域里,且只在一個域里(精確定位)
2.每個域下都可以根據(jù)需要再分子域,不限定層級(最自由方便)
3.如果分子域就不能放表,表只放在最底層的域中(樹狀目錄管理時更方便)
4.最好保證每個域下的子域數(shù)量或表數(shù)量在20個左右(太多了不方便記憶管理,太少了沒必要劃分)
5.【其他】很好用,不好劃分的都放里面(減少域?qū)蛹墧?shù)量有理由理解記憶)
6.數(shù)據(jù)團隊分域可以作為分工的標準(數(shù)據(jù)不重、分工明確、界限清晰)
7.數(shù)據(jù)團隊分域后,可以決定域內(nèi)表的中間命名(看到表名時可以理解更多信息)
(部分內(nèi)容來源網(wǎng)絡,如有侵權(quán)請聯(lián)系刪除)