一、元數據的定義
元數據,為描述數據的數據,主要是描述數據屬性的信息,用來支持如指示存儲位置、歷史數據、資源查找、文件記錄等功能。元數據算是一種電子式目錄,為了達到編制目錄的目的,必須在描述并收藏數據的內容或特色,進而達成協助數據檢索的目的。
二、元數據的作用
1、幫助用戶理解數據倉庫中的數據
元數據可以實現業務模型與數據模型之間的映射,因而可以把數據以用戶需要的方式“翻譯”出來,從而幫助最終用戶理解和使用數據。
2、元數據是進行數據集成所必需的
當數據集市數量增多時很容易形成“蜘蛛網”現象,而元數據管理是解決“蜘蛛網”的關鍵。如果在建立數據集市的過程中,注意了元數據管理,在集成到數據倉庫中時就會比較順利;相反,如果在建設數據集市的過程中忽視了元數據管理,那么最后的集成過程就會很困難,甚至不可能實現。
3、元數據可以支持需求變化
傳統的信息系統往往是通過文檔來適應需求變化,但是僅僅依靠文檔還是遠遠不夠的。成功的元數據管理系統可以把整個業務的工作流、數據流和信息流有效地管理起來,使得系統不依賴特定的開發人員,從而提高系統的可擴展性。
4、元數據是保證數據質量的關鍵
借助
元數據管理系統,最終的使用者對各個數據的來龍去脈以及數據抽取和轉換的規則都會很方便地得到,這樣他們自然會對數據具有信心;當然也可便捷地發現數據所存在的質量問題。甚至國外有學者還在元數據模型的基礎上引入質量維,從更高的角度上來解決這一問題。
三、數據模型、數據標簽的定義及作用
數據模型,是數據特征的抽象,它從抽象層次上描述了系統的靜態特征、動態行為和約束條件,為數據庫系統的信息表示與操作提供一個抽象的框架。數據模型是數據庫設計中用來對現實世界進行抽象的工具,是數據庫中用于提供信息表示和操作手段的形式構架。數據模型是數據庫系統的核心和基礎。它的作用是現實世界數據特征的抽象,或者說是現實世界的數據模擬。數據庫中,用數據模型來抽象地表示現實世界的數據和信息。
數據標簽,是一種用來描述業務實體特征的數據形式。通過標簽可以有效擴充業務實體的分析角度,且通過對不同標簽的簡單操作,便可進行數據篩選和分析。比如對用戶進行刻畫時,可以從“性別”、“年齡”、“地區”、“興趣愛好”、“產品偏好”等角度進行描述。通過不斷豐富數據標簽,盡可能多的擴展分析角度,能夠更全面、更準確地對分析對象進行刻畫。