談及企業數據的核心與靈魂,便不得不引出“
主數據”這一關鍵概念。本文將帶您揭開主數據的面紗,探討其在企業數據中的地位,辨析主數據與參考數據、
數據標準的微妙差異,并闡述數據標準、
數據質量與主數據的相互關聯。通過生動形象的類比,我們期望能夠為您搭建起一座理解主數據及其相關知識的橋梁。
01什么是主數據
主數據,作為企業核心業務的關鍵信息單一來源,支撐著企業的關鍵業務流程與事務。這一表述強調了主數據在企業運營中的核心與重要性,將其視為企業的“黃金數據”。
具體而言,主數據是描述企業核心業務的主體,主要有資產、地點、客戶、供應商以及產品等。這些主數據共同具備四個顯著特性:唯一性、共享性、穩定性與有效性。
為了更直觀地理解這些特性,我們可以對比一些非主數據。以訂單為例,雖然每個微信訂單號都是唯一的,且在一定程度上具有共享性(即在訂單從產生到結束的整個流程中),但其生命周期相對較短,且其共享范圍也僅限于該流程內部。此外,盡管訂單會被多個系統使用,但其穩定性與長期有效性并不如主數據。訂單的有效性僅限于其生命周期內,而不像產品那樣會在多個系統中長期穩定地使用。
因此,像訂單這類信息,由于其不具備主數據的全部特性,我們一般不將其列為主數據的范疇。這一判斷標準有助于我們更清晰地界定主數據與非主數據的界限,從而更好地進行數據管理與利用。
02企業數據范圍
企業數據的范疇廣泛,包括交易數據、主數據、分析數據、IOT物聯網數據等。在此,小億大致將企業相關數據劃分為企業外部數據和企業內部數據兩大類進行詳細闡述。其中,物聯網數據是一個既涵蓋企業內部又涉及企業外部的重要領域。
就企業內部而言,首先企業的核心關鍵數據,即主數據。進一步擴展,則涵蓋了企業日常的經營數據,如采購數據、銷售數據、生產數據等。基于這些經營數據和主數據,我們可以進一步生成企業內部所需的分析數據,這些數據主要是通過生產經營的加工匯總得出的,包括業績統計、關鍵KPI指標、
財務報表以及決策支持數據等,它們共同構成了企業內部的關鍵數據體系。此外,企業還會涉及傳感器、設備、儀表等相關數據,以及日志數據和監控數據等,這些都屬于物聯網數據的范疇。
另一方面,企業外部數據主要涉及兩大板塊。首先是與企業有一定聯系的相關數據,如友商數據、電商數據、銀行貸款數據以及工商、稅務、法院等涉及企業的數據。這些數據雖然與企業有一定的距離,但仍然是企業運營中不可或缺的信息來源。
再往上,則可能涉及一些更為社會化的數據,如社交媒體數據(包括微信等社交平臺的數據)、政府公開的政策法規數據等。這些數據看似與企業距離較遠,但實際上,它們同樣對企業的運營產生著重要影響。例如,政策法規的變化可能直接影響企業的經營策略,而社交媒體數據則能反映出消費者的需求和偏好,為企業的市場營銷提供有力支持。
從重要性而言,企業數據的價值挖掘和利用是一個從內到外的過程。首先,我們需要做好組織內部的數據管理和分析工作,提升組織力。然后,逐步向外擴展,將外部數據納入企業的數據體系中,為企業的經營決策提供更為全面和準確的信息支持。這樣,企業數據才能真正發揮其價值,為企業的持續發展提供有力保障。
03容易混淆的3個概念
接下來,小億將闡述幾個容易混淆的概念:參考數據、主數據以及數據標準。
之所以將這三個概念放在一起討論,是因為它們在
數據治理理論中緊密相連,比如參考數據和主數據在DAMABOK中是同一章節,而主數據和數據標準在實際項目中則常常引發人們的困惑。例如,人們可能會疑問:建立了主數據體系后,是否還需要制定數據標準?反之亦然。這兩者之間到底有多少交集,又有多少不重疊的部分?它們各自在哪些領域更為擅長,能在數據治理的哪個環節提供不同的解決思路或解決不同的問題?
為了解答這些疑問,將對這三個概念進行詳細講解。

1.參考數據
參考數據管理的是對定義的數據域中關聯的數據值進行管理,包括標準化術語、代碼值、唯一標識符,以及其他數據取值所需的業務定義等。
簡單來說就是我們日常所說的碼表或維度,如郵編、地區、性別、學歷等。這些參考數據相對固定,無論是維度的編碼規范還是命名方式,無論是國家標準還是行業標準,都遵循一定的標準。它們已經具備了宏觀和微觀的參考面,形成了具有參考價值的數據。
2.主數據
企業主數據是指企業內部一致共享的業務主體。主數據則更多地關注數據的源頭管理,它不僅僅局限于軟件層面,而是對數據本身進行源頭上的管理和控制。
3.數據標準
至于數據標準,它實際上是對數據過程的管理。與主數據相比,數據標準在本質上存在區別。數據標準更注重數據在流轉過程中的規范性、一致性和準確性,以確保數據在整個生命周期內都能保持高質量。對于主數據而言,也有主數據的數據標準,數據標準不僅確保了數據在采集、存儲、處理和傳遞過程中的高質量,還為主數據的源頭管理提供了規范和指導。
主數據與數據標準是相互關聯、相輔相成的。數據標準為主數據的源頭管理提供了規范和指導,而主數據的源頭管理則確保了數據在整個生命周期內的高質量。通過制定和實施主數據的數據標準,企業可以更好地管理和利用主數據,支持企業的決策和業務發展。
04一個類比闡述區別
下面,我將通過舉例和形象類比的方式,重點闡述主數據和數據標準的區別。由于參考數據相對容易理解,因此在此不再贅述。

首先,我們來看一個日常
數據倉庫(DW)三層建設的標準流程(如上圖),這一流程大家應該較為熟悉。而主數據的應用路徑則有所不同,它并未進入數據倉庫,而是直接從業務系統的源頭對數據進行處理和管控。相比之下,數據標準則是在數據從生產環節產生后進入數據倉庫或數據湖的過程中,對數據流轉加工進行監督和落標管理。
為了更形象地說明這一點,舉了一個可能不太恰當的例子,但相信能夠幫助大家理解。主數據就像交警,而數據標準則像協警。交警主要出現在關鍵和主要的路口,擁有執法權和處罰權,負責維護交通秩序和制定交通法規。而協警則出現在各個路口,協助管理交通,但沒有執法權,只能配合交警處理相關事務。
在這個類比中,主數據就像交警一樣,在數據流程的關鍵環節進行管控和治理,確保數據的準確性和一致性。而數據標準則像協警一樣,在數據流轉的過程中提供監督和指導,確保數據符合既定的標準和規范。
此外,還想穿插一個與主數據、數據標準緊密相關的概念,那就是數據質量。數據質量可以類比為查酒駕的執法人員,他們不僅查酒駕,還可以查毒駕、違章、超速等。在數據流轉的各個環節中,數據質量負責檢查數據的準確性和合規性,確保數據符合既定的質量規則。
因此,主數據、數據標準和數據質量這三者緊密相連,共同構成了數據治理的核心。它們既可以作為整個數據治理過程的重要組成部分,也可以結合使用,對數據的質量進行全方位的把控和提升。
(部分內容來源網絡,如有侵權請聯系刪除)