元數據管理要符合企業數據現狀,要能支撐企業數據人員分析數據的需要,元數據是企業數據資產的最原始詞典,我們需要從這本詞典中獲取到準確的數據信息,準確、便捷、深度、廣度是元數據管理努力的方向。

要實現企業元數據管理需從兩個方面考慮,一是盤點企業數據情況,搞清楚要管理哪些元數據以及這些元數據在什么地方,以何種形態存儲,他們之間有有著怎樣的聯系。二是建模,這里的建模是建立元數據的模型及元模型,要抽象出企業的元模型,建立個元模型之間的邏輯關系。總結的講盤點企業數據資產和建立企業元模型是元數據管理的兩個基本步驟。下面我們展開的講一下這兩點:
企業數據資產盤點,首先要把元數據建設的定位定義清楚,短期解決什么問題,長期達到什么目的,基于短期目標要重點細化。舉個例子要實現企業物理模型的全面管理,實現數據結構變更一體化管理這個短期目標,那么就需要盤點企業有多少應用系統,每個應用系統有多少個數據庫,數據庫的種類有什么,哪些是業務數據表,哪些是垃圾數據表,每個數據字段的含義是否完整,每個系統那個業務部門使用,哪些管理員進行運維,企業的數據變更是否有流程驅動等。將以上信息分為兩大類,一類是數據模型本身的元數據信息,一類是支撐數據模型管理的元數據信息,這兩類信息都是需要盤點的內容。
元數據建模,元數據建模是對企業要管理的元數據進行結構化、模型化。元模型的構建要一般要參考公共倉庫元模型CWM,但也不能照搬CWM,否則構建的元模型太過臃腫,不夠靈活。在構建元模型過程中不但要關心模型的結構更要關系模型間的關系,每個模型在元數據的世界里是一個獨立的個體,個體和個體之間的關系賦予了模型間錯綜復雜的關系圈,這些關系的創建往后衍生會支撐數據圖譜或知識圖譜的構建。再拿數據資產盤點的例子來講,我們要建立數據庫元模型、表元模型、字段元模型、管理員元模型,其中庫-表-字段是通過組合關系來構建的,而表-表、字段-字段是通過依賴關系來構建的。通過這樣的關系構建就能將企業中的所有有交互的數據形成一個錯綜復雜龐大的數據關系網絡,
數據分析人員就可以基于這張網絡進行各種信息的挖掘。
(部分內容來源網絡,如有侵權請聯系刪除)