數據治理概述
對企業(yè)數據資產進行規(guī)范化管理已經成為廣泛認可的實踐,但確保數據管理職能得到正確履行需要組織架構、原則、過程和規(guī)則。數據治理的定義多樣,包括來自權威機構如DAMA、ISACA、DGI、IBM和Gartner的多種觀點。DAMA提出的數據治理定義被業(yè)界廣泛接受,其將數據治理定義為對
數據資產管理行使權力和控制的活動集合(計劃、監(jiān)督和執(zhí)行)。
數據治理旨在確保在數據資產管理過程中,相關決策始終準確、及時和有前瞻性,數據管理活動始終規(guī)范、有序和可控,數據資產得到正確有效的管理,并最終實現
數據資產價值的最大化。數據治理應遵循正式、書面、可重復、可循環(huán)和可優(yōu)化的過程,以及標準的、成熟的、獲得廣泛認可的規(guī)范。在數據治理的生命周期中,過程和規(guī)范應高度契合,以確保數據治理具有約束性和紀律性,始終保持正確的方向。
綜上所述,數據治理的核心在于對企業(yè)數據進行有效管理和利用的評估、指導和監(jiān)督,通過高質量的數據不斷創(chuàng)新數據服務,實現數據資產價值最大化,為企業(yè)
數字化轉型提供強勁動力,為企業(yè)創(chuàng)造數字化價值。
數據治理與數據管理的關系建立在治理與管理之間的互動基礎上。治理負責對管理活動進行評估、指導和監(jiān)督,而管理則根據治理的決策具體計劃、建設和運營。大數據治理是數據治理的新領域,旨在評估、指導和監(jiān)督組織的大數據利用。它通過制定戰(zhàn)略方針、建立組織架構、明確職責分工等方式,實現大數據的風險可控、安全合規(guī)、績效提升和價值創(chuàng)造,并提供不斷創(chuàng)新的數據服務。因此,大部分數據治理的方法論也適用于大數據治理,盡管需要在某些管理領域進行適當調整。
為什么要進行數據治理
盡管一些企業(yè)認為目前的數據規(guī)模很小且易于控制,暫時不需要進行數據治理,但實際使用中仍然會遇到諸多問題:
數據監(jiān)管不力,導致臟數據出現;
數據體系規(guī)模逐漸擴大,管理混亂;
數據血緣丟失,無法回溯舊數據。
無論企業(yè)的數據規(guī)模如何,我認為制定數據治理規(guī)劃仍然是必要的。為了考慮成本問題,可以分階段進行實施。數據治理的必要性體現在以下幾個方面:
數據的可用性和異常值的處理;
數據的來源和去向的血緣信息;
數據訪問的安全性;
新數據加工的規(guī)范參考和標準管理。
提前制定數據治理規(guī)劃可以節(jié)省后續(xù)改造成本,避免冗余重構或重新開始的情況發(fā)生。數據治理有助于在合理高效的監(jiān)管體系下提供高質量、安全、可追溯的業(yè)務數據。
數據治理的幾點誤區(qū)
數據治理是否要做得全面。不同階段和規(guī)模的企業(yè),數據治理的實施程度會有所不同,建議根據自身情況分階段進行,避免盲目擴大規(guī)模。
數據治理僅限于技術考慮。數據治理是整個組織的協(xié)作過程,包括業(yè)務線和管理組織,沒有好的實施方案和協(xié)作機制,往往會事倍功半。
數據治理的短期見效性。數據治理是一個長期的過程,會隨著企業(yè)數據規(guī)模和數倉規(guī)劃的變更而調整,部分功能可能會在短期內見效,但完整體系的搭建短期難以實現。
數據治理需要先有工具平臺。盡管工具和技術手段很成熟,但需要先有成熟的數據治理體系規(guī)劃和策略。
數據治理的模糊性。數據治理是一個長期的工作,需要相關從業(yè)者根據企業(yè)的數據現狀和管理模式去構建和調整,建議邊做實踐邊總結歸納,采取小步慢跑的方式。
數據治理技術體系1、元數據管理
元數據,即企業(yè)數據的DNA,是數據治理過程中不可或缺的一環(huán)。元數據管理涵蓋了元數據的創(chuàng)建、存儲、整合和控制,是數據治理不可或缺的一部分。

基于業(yè)務需求,
元數據管理系統(tǒng)的建設可劃分為以下四大模塊:
(1) 元數據獲取:統(tǒng)一收集、存儲和輸出各階段的元數據,包括自動獲取和手工獲取兩部分。
(2) 元
數據存儲:包括存儲元數據和元模型。
(3) 元數據功能:包括元數據的基礎操作(如查詢、新增、修改和刪除等管理操作)、元
數據分析(包括業(yè)務指標一致性分析、數據血統(tǒng)分析、數據影響分析等)、元數據權限管理以及元數據服務封裝等。
(4) 元
數據應用:包括元數據基礎能力開放、報表指標優(yōu)化清理應用、指標運算關系分析應用等。
2、主數據管理
主數據是數據的源頭,圍繞主數據需求進行的數據治理工作往往成為各類組織推進業(yè)務數字化的首要任務。

主數據項目實施的標準流程分為咨詢規(guī)劃和實施落地兩大部分,主要包括以下四個步驟:
(1) 現狀分析與評估:了解企業(yè)現狀,識別企業(yè)當前問題以及數據管理成熟度。
(2) 體系規(guī)劃階段:設計企業(yè)內部的組織架構、主數據管理制度、標準規(guī)范以及主數據運營。
(3) 主數據實施:根據頂層設計規(guī)劃,制定編碼分類、屬性、字段、審批流程、整合清洗分發(fā)、集成切換策略等。
(4) 平臺落地:將主數據實施內容落實到
主數據管理平臺上,包括主數據模型、主數據維護以及相關治理內容。
3、數據標準管理
數據標準化是企業(yè)數字化轉型的基礎,與企業(yè)數據管理的每個領域都密切相關,是數據治理工作的基礎內容。

數據標準的建立通常包括以下五個步驟:
(1) 標準規(guī)劃:構建數據標準分類框架,并制定開展數據標準管理的實施路線。
(2) 標準制定:在完成標準分類規(guī)劃的基礎上,定義數據標準及相關規(guī)則。
(3) 標準發(fā)布:征詢意見,并在完成意見分析和標準修訂后進行標準發(fā)布。
(4) 標準執(zhí)行:將企業(yè)發(fā)布的數據標準應用于信息建設,以消除數據不一致。
(5) 標準維護:根據業(yè)務發(fā)展變化和數據標準執(zhí)行效果不斷更新和完善數據標準。
4、數據質量管理
數據質量管理涉及到數據生命周期各個階段可能引發(fā)的各類數據質量問題的識別、度量、監(jiān)控和改善,以提高數據質量。

全國信息技術標準化技術委員會提出了數據質量評價指標(GB/T36344-2018 ICS 35.24.01),包括完整性、一致性、準確性、時效性、唯一性和可訪問性。
提升數據質量可參考以下七大步驟:
(1) 定義高質量數據:明確數據質量改進的目標和優(yōu)先級。
(2) 定義數據質量戰(zhàn)略:確保數據質量優(yōu)先級與業(yè)務戰(zhàn)略一致。
(3) 識別關鍵業(yè)務和質量規(guī)則:確定關鍵數據后,識別梳理數據質量特征要求的業(yè)務規(guī)則。
(4) 執(zhí)行初始數據質量評估:定義可操作的改進計劃。
(5) 識別改進方向并確定優(yōu)先級:分析問題的業(yè)務影響,確定優(yōu)先順序。
(6) 定義數據質量改進目標:量化業(yè)務價值,設定具體的可實現目標。
(7) 開發(fā)和部署數據質量操作:制定實施計劃,管理數據質量規(guī)則和標準、監(jiān)控數據與規(guī)則的執(zhí)行一致性,識別和管理數據質量問題,并報告質量水平。
5、數據交換共享
數據交換共享主要用于實現不同機構不同系統(tǒng)之間的數據或文件傳輸和共享,以消除數據孤島,提高信息資源的利用率。
數據資源交換共享與開發(fā)應用平臺按數據的流向自下而上分為五層,包括外部數據資源層、數據匯聚層、數據融合層、服務管理層和服務門戶層。
6、數據安全治理
數據安全管理是用來實現和維護數據保密性、完整性、可用性、可核查性、真實性和可靠性的過程。

要做好數據安全治理,需要完善數據安全治理規(guī)劃,提高數據安全技術防護能力,并加強數據安全審計。
7、數據生命周期管理
數據生命周期管理是一種基于策略的方法,包括數據的創(chuàng)建、使用、歸檔和銷毀的策略和過程。
數據生命周期管理涉及數據的創(chuàng)建、使用、歸檔和銷毀等階段,需要制定相應的策略和措施。
總結
國內數據治理的主要成果主要體現在數據治理的范圍、原則和促進因素方面。企業(yè)在開展數據治理工作時,應綜合利用現有成果,結合自身特點,構建統(tǒng)一的數據治理框架和方案,以有效發(fā)揮企業(yè)數據資產的價值,引領數字化轉型的進程。
(部分內容來源網絡,如有侵權請聯系刪除)