一、主數據的概念
主數據(Master Data):在企業中用來定義業務對象的、具有持續性、非交易類的數據。相對于交易類數據,主數據是相對穩定的數據。
二、主數據具備3個主要特征
1、高共享:主數據是跨部門、跨系統高度共享的數據。
2、相對穩定:與交易數據相比主數據是相對穩定的,變化頻率較低。變化頻率較低并不意味著一成不變,例如:客商更名會引起客商主數據的變動、人員調動會引起人員主數據的變動等等。
3、高價值:主數據是所有業務處理都離不開的實體數據,與大數據相比價值密度非常高。
三、主數據的4個超越
1、超越部門,主數據是組織范圍內共享的、跨部門的數據,不歸屬某一特定的部門,是企業的核心數據資產。
2、超越業務:主數據是跨越了業務界限,在多個業務領域中被廣泛使用的數據,其核心屬性也是來自業務。例如:物料主數據,它有自身的自然屬性,如:規格、材質,也有業務賦予的核心屬性,如:設計參數、工藝參數、采購、庫存要求、計量要求、財務要求等。同時,物料主數據也要服務于業務,可謂是———從業務中來到業務中去。
3、超越技術,主數據是要解決不同異構系統之間的核心數據共享問題,從來不會局限于一種特定的技術。在不同環境、不同場景下,主數據的技術是可以靈活應對的。
4、超越系統,主數據是多個系統之間的共享數據,是應用系統建設的基礎,同時也是數據分析系統重要的分析對象。
四、主要作用
主數據是項目的最關鍵、最核心的數據,重點用來解決異構系統之間關鍵數據的不一致、不正確、不完整等問題。主數據是信息系統建設和大數據分析的基礎,被認為是企業數字化轉型的基石。
五、主數據管理系統實施
主數據管理系統實施階段的重中之重,主要內容包括數據采集、數據清洗和數據導入。
1、數據采集
在數據采集前,項目組為了提高準備數據的質量,應說明關鍵字段的含義、系統使用原理 以及和原系統數據的對應關系。
在數據采集的工具方面,一種方法是利用業務系統的數據導出工具,通過人工的方式整理為標準的數據采集格式;另一種是由項目組開發一套數據采集軟件。
2、數據清洗
數據清洗的目的是檢測數據中存在的錯誤和不一致,剔除或者改正它們,將剩余部分轉換成數據標準所接受的格式,提高數據質量。
3、數據導入
數據導入工作的過程包括導入設計、編碼、導入測試和正式導入等步驟。
1)導入設計
確定要導入的數據類型和對應的數據屬性,導入目標數據庫表中數據類型和元數據類型的對應關系等,形成數據字典對照報告和數據導入設計報告。
2)編碼
根據數據導入字典對照報告、數據導入設計報告、程序設計報告編寫數據導入程序,并對數據導入程序進行功能測試。如果采用系統專用的導入工具,則可忽略這一步。
3)導入測試
對備份數據進行導入,進行合理性和正確性校驗。對導入完畢的數據通過總體數據對比,關鍵性數據的逐項對比以及人工抽查等方式校驗數據導入的正確性。
數據導入實驗后,要采用導入后的數據運行新系統,以檢查新系統的運行情況。對 數據導入過程中發現的一些有問題的數據,找出批量修改的方法。如果無法應用程序進 行批量處理,則需要人工修正。
4)正式導入
在原系統的數據經過了導入實驗,并且有問題的數據都進行修正處理后,方可開始進行新系統數據的正式導入。正式的數據導入要在舊系統停止辦理業務的情況下進行,數據導入工作的時間必須集中,爭取一次導入成功,以將新舊系統切換帶來的風險降到最低。