- 產品
- 產品解決方案
- 行業解決方案
- 案例
- 數據資產入表
- 賦能中心
- 伙伴
- 關于
時間:2022-05-26來源:無理詩人瀏覽數:880次
數據模型是一種可視化的表示,它將抽象的想法轉化為技術實施計劃。它們有助于避免代價高昂的數據基礎架構拆除和重建,因為數據建模人員需要在創建數據庫和倉庫之前考慮他們需要的數據、數據關系、數據架構,甚至項目是否可行。數據模型還有助于數據治理和法律合規性。
一 概述
通過使用數據模型,開發人員、數據架構師和業務分析師等各種利益相關者可以在構建數據庫和倉庫之前就他們將捕獲的數據以及他們希望如何使用這些數據達成一致。數據模型指定要捕獲哪些信息、如何存儲它以及它如何與業務的各個組件相關聯。數據建模的最終目標是為整個組織建立清晰的數據標準。例如,電子商務網站的模型可能會指定將捕獲的客戶數據。它將定義如何標記該數據及其與產品信息和銷售流程的關系。就像房子的藍圖一樣,當事情變得復雜時,數據模型在開始建造之前定義了要建造什么以及如何建造。這種方法可以防止數據庫設計和開發錯誤、捕獲不必要的數據以及在多個位置復制數據。
二 數據模型類型數據模型分為三類:概念模型、邏輯模型和物理模型。它們幫助利益相關者圍繞數據項目的原因、方式和內容保持一致。每種類型的模型在數據建模過程中服務于不同的目的和受眾。
1概念數據模型概念數據模型以可視化方式管理正在建模的業務流程的概念和規則,而無需深入了解技術細節。可以使用此可視化模式來使業務利益相關者、系統架構師和開發人員在項目和業務需求方面保持一致:數據系統將包含哪些信息、元素應如何相互關聯以及它們的依賴關系。通常,概念模型表示系統內容、組織和相關業務規則的高級視圖。例如,電子商務業務的數據模型將包含供應商、產品、客戶和銷售,業務規則是每個供應商需要提供至少一種產品。概念模型沒有標準格式。重要的是,它可以幫助技術和非技術利益相關者就其數據項目的目的、范圍和設計達成一致。以下圖形都是概念數據模型的示例。

2邏輯數據模型邏輯數據模型基于概念模型并定義項目的數據元素和關系,可以看到數據庫中特定實體的名稱以及它們的屬性。繼續使用電子商務示例:邏輯模型顯示產品是通過“產品 ID”標識的,具有描述、類別和單價等屬性。數據架構師和業務分析師使用邏輯數據模型來規劃數據庫系統中的實施。以下是邏輯數據模型的示例。
3物理數據模型物理數據模型變得技術化。數據庫分析師和開發人員使用它來設計數據庫和相關數據結構。該模型指定了將存儲的數據類型以及技術數據要求。數據類型規范的例子是:一條數據是整數(不帶小數點的數字)還是浮點型(帶小數位的數字)。技術要求包括有關存儲需求、訪問速度和數據冗余的詳細信息——將一條數據存儲在多個位置以提高持久性并提高查詢性能。
在實踐中,只有非常大的項目,比如為供應鏈業務建模,才會從概念模型轉向邏輯模型再到物理模型。大多數其他項目跳過概念階段,將大部分時間花在邏輯建模上。一些團隊甚至同時涵蓋物理階段的元素,因為從事邏輯模型的人員也負責技術實施。
三 三大數據建模技術有許多不同的技術來設計和構建數據庫。應該探索這些技術,并在概念階段結束時確定最適合的技術。這些數據建模方法定義了數據庫的結構化方式,并與可用于管理數據項目的格式或技術類型密切相關。
1.關系數據建模在關系數據模型中,數據存儲在表中,其中特定元素鏈接到其他表中的信息。實體可以具有一對一、一對多或多對多的關系。關系數據庫通常使用 SQL(結構化查詢語言)語言,用于訪問和管理數據。它們經常用于CRM系統以及其他類型的交易處理。

實體-關系模型(有時稱為 ER 模型)類似于關系模型。它展示了系統中不同元素之間的關系,但不涉及技術細節。可以在概念階段使用 ER 模型來協調技術和非技術利益相關者。
2.維度數據建模理解維度數據模型,可以想象一個立方體。立方體的每一面都代表嘗試捕獲的數據的一個方面。例如,假設企業向不同的客戶群銷售多種產品,并且要評估一段時間內的銷售業績。可以將其展現為具有時間、產品和客戶細分維度的數據立方體。通過在立方體的軸上上下左右移動,可以在所有這些維度上進行比較。我們將在任何時間看到這些產品的銷售額如何相互比較以及不同的客戶群。
在概念階段使用立方體模型。這種多維數據集在邏輯階段最常見的表現之一是“星型模式”,如下圖所示。起初,它可能看起來像一個關系模型。盡管如此,星型模式還是不同的,因為它有一個連接到許多其他節點的中心節點。
3.圖數據建模在概念階段,大多數人在白板上繪制數據模型。這樣的草圖類似于圖模型。它由“節點”和邊組成——節點代表數據存儲的位置,邊代表節點之間的關系。這也是這種方法的主要優點:“你在白板上畫的東西就是你存儲在數據庫中的東西。”
其他技術要求將概念階段的輸出轉換為邏輯和物理實現的不同格式,例如,從 ER 轉換為關系模型或從多維數據集模型轉換為星型模式。圖模型并非如此,可以使用 Neo4j 等技術直接實現它們,Neo4j 是一個原生圖形數據庫平臺。
四數據模型管理的價值數據模型是一種可視化的表示,它將抽象的想法轉化為技術實施計劃。它們有助于避免代價高昂的數據基礎架構拆除和重建,因為數據建模人員需要在創建數據庫和倉庫之前考慮他們需要的數據、數據關系、數據架構,甚至項目是否可行。數據模型還有助于數據治理和法律合規性。它要求從項目一開始就設置標準,這樣團隊就不會遇到沖突的數據集,這些數據集需要在使用之前進行清理,或者更糟糕的是,根本無法使用。數據模型和標準化有助于避免在整個組織中以近十種不同方式標記的注冊字段之類的情況。它還有助于在建模時識別敏感信息(社會保險號、密碼、信用卡號),以便在開始構建之前讓安全和法律專家參與進來。安全、準確和高質量的數據為組織中的各個團隊帶來了一系列現實的好處。產品團隊可以更快地迭代并構建身臨其境的用戶體驗。分析和商業智能團隊無需繁重的變通方法即可創建查詢。