數(shù)據(jù)倉庫結(jié)構(gòu)體系-體系結(jié)構(gòu)
(1)數(shù)據(jù)源是數(shù)據(jù)倉庫系統(tǒng)的基礎(chǔ),是整個系統(tǒng)的數(shù)據(jù)源泉,通常包含企業(yè)內(nèi)部信息和外部信息。
(2)數(shù)據(jù)的存儲與管理是整個數(shù)據(jù)倉庫系統(tǒng)的核心。數(shù)據(jù)倉庫依照數(shù)據(jù)的覆蓋范圍能夠分為企業(yè)級數(shù)據(jù)倉庫和部門級數(shù)據(jù)倉庫(通常稱為
數(shù)據(jù)集市) 。
(3)OLAP (On Line Analytical Processing)server對分析須要的數(shù)據(jù)進行有效集成,按多維模型予以組織,以便進行多角度、多層次的分析,并發(fā)現(xiàn)趨勢。
(4)前端工具主要包含各種
報表工具、查詢工具、
數(shù)據(jù)分析工具、數(shù)據(jù)挖掘工具以及各種基于數(shù)據(jù)倉庫或數(shù)據(jù)集市的應用開發(fā)工具。
數(shù)據(jù)倉庫結(jié)構(gòu)體系-事實表和維表
事實表和維表是多維模型中的兩個基本概念。
事實表是數(shù)據(jù)分析所相應的主要數(shù)據(jù)項,通常是企業(yè)內(nèi)的某項業(yè)務或某個事件。事實表中的事實一般具有數(shù)據(jù)特性和可加性,事實表中能夠存儲不同粒度的數(shù)據(jù),同一主題中不同粒度的數(shù)據(jù)一般存儲在不同的事實表中。
維表中包括的通常是描寫敘述性的文本信息,這些文本信息將成為事實表的檢索條件。維表中的維屬性應該詳細明白,體現(xiàn)出維層次的劃分,可以成為分析型查詢的約束條件,這是數(shù)據(jù)倉庫與操作型應用在數(shù)據(jù)模型設計上的一個不同點。維表層次的級別數(shù)量取決于查詢 的粒度。在實際業(yè)務環(huán)境中,多維數(shù)據(jù)模型一般含有4~15維,很多其它的維數(shù)或更少的維數(shù)一般都非常少見。在詳細工作中,設計人員一定要依據(jù)企業(yè)的實際情況確定對應的維。
在多維模型中,事實表的主碼是組合碼,維表的主碼是簡單碼,事實表中與維表主碼相相應的各個組成部分是外碼。事實表通過與各維相相應的外碼值同維表聯(lián)系在一起。查詢時通過事實表和維表之間的這樣的相應關(guān)系。
數(shù)據(jù)倉庫結(jié)構(gòu)體系-數(shù)據(jù)組織結(jié)構(gòu)
星型模型? ? ?
多維數(shù)據(jù)建模以直觀的方式組織數(shù)據(jù),并支持高性能的數(shù)據(jù)訪問。每個多維數(shù)據(jù)模型由多個多維數(shù)據(jù)模式表示,每個多維數(shù)據(jù)模式都是由一個事實表和一組維表組成的。多維模型最常見的是星形模式。在星形模式中,事實表居中,多個維表呈輻射狀分布于其四周,并與事實表連接。
位于星形中心的實體是指標實體,是用戶最關(guān)心的基本實體和查詢活動的中心,為數(shù)據(jù)倉庫的查詢活動提供定量數(shù)據(jù)。每一個指標實體代表一系列相關(guān)事實,完畢一項指定的功能。位于星形圖星角上的實體是維度實體,其作用是限制用戶的查詢結(jié)果,將數(shù)據(jù)過濾使得 從指標實體查詢返回較少的行,從而縮小訪問范圍。每一個維表有自己的屬性,維表和事實表通過keyword相關(guān)聯(lián)。
雪花模型
雪花模型是對星型模型的擴展,每一個維度都可向外連接到多個具體類別表。在這樣的
模式中。維度表除了具有星型模型中的維度表功能外,還連接上對事實表
進行具體描寫敘述的洋細類別表。具體類別表通過對事實表在有關(guān)維上的具體描寫敘述,達到了縮小事實表、提高查詢效率的目的。
(部分內(nèi)容來源網(wǎng)絡,如有侵權(quán)請聯(lián)系刪除)